«Будущее будет намного больше похоже на настоящее, чем нам кажется»
текст:
Максим Селезнев
В это воскресенье Лев Манович, теоретик цифровой культуры и новых медиа и профессор компьютерных наук Городского университета Нью-Йорка, проведет лекцию в Музее криптографии о том, сможет ли искусственный интеллект заменить художников (об этом в том числе будет грядущая книга Мановича «Искусственная эстетика: критическое руководство по ИИ, медиа и дизайну»). О том, как работают современные нейросети, в чем их отличия от Рембрандта и как можно использовать искусственный интеллект, чтобы по-новому взглянуть на историю искусства и кураторские практики с ним, по просьбе The Blueprint поговорил поговорил преподаватель Школы дизайна и видеоэссеист Максим Селезнев.
Лекция, которую вы будете читать на конференции «Screenshots_2023» в Музее криптографии, называется «Один миллиард Рембрандтов? ИИ, генеративные медиа и история искусства». Когда видишь слово «искусство» в контексте новых медиа, сразу возникает вопрос — что именно под ним подразумевается?
Первый раз я встретился с компьютерными медиа в 1984 году, то есть почти 40 лет назад. Это был даже не Macintosh, а какой-то предыдущий продукт Apple с программой Paint, 16 цветами и кисточкой. С этого момента в центре моего внимания как педагога, лектора, писателя оставались именно компьютерные инструменты и ресурсы. За это время я пережил несколько медиареволюций — Macintosh предложил образцовые программы для рисования, черчения, создания музыки. Позже — возникла реалистичная компьютерная графика, в том числе трехмерная, в 1993–1995 годах появился Web.
С 2015 года интересные процессы стали происходить с нейронными сетями, когда появился DeepDream, придуманный очередным русским гением, работавшим в Google, а настоящий же прорыв произошел летом прошлого года с Midjourney. Тогда все интеллектуалы вокруг меня бросили дела и стали в это играть. Я тоже почти каждый день на протяжении полугода использовал эти инструменты, Midjourney дал мне возможность вернуться к визуальным работам и поставить их создание на первое место. Ведь с этой сетью можно попробовать очень много идей за короткое время. И так возник спонтанный формат — я публиковал посты в соцсетях, иногда просто картинки, но часто картинки с каким-то теоретическим текстом. И вот сейчас я заканчиваю большую статью из 25 разных тезисов на тему нейросетей. А лекция, которую я буду читать, — выборка из нескольких тезисов. Самые последние идеи, которые пришли мне в голову и которые мне особенно хочется сейчас обсудить.
Лекцию можно было бы назвать: «Искусственный интеллект в контексте теории медиа», но это звучит слишком неповоротливо и академично. Конечно, термин «история искусства» прагматичен. И все-таки слово «история» для меня здесь важно. Что отличает меня от многих людей, интересно пишущих и размышляющих на эту тему? Как раз знание истории искусства, архитектуры, медиа. Так что здесь речь не столько про «историю искусства», сколько про контекст человеческой истории как таковой. Но если у вас есть предложение, как улучшить название, с удовольствием послушаю. ChatGPT мне с этим тоже не помог.
Вы сейчас сказали о революционном прорыве, случившемся летом 2022 года. Можно ли назвать какие-то принципиальные качественные изменения, отличающие современные инструменты от того, что уже полстолетия назад практиковали, например, Нам Джун Пайк с его препарированными телевизорами или Майкл Сноу с «Центральным регионом», фильмом, снятым машиной (почти) без участия человека?
Да, конечно, есть целый набор новых свойств. Даже если оттолкнуться от ваших примеров. Нам Джун Пайк ведь реагирует на уже сложившуюся индустрию телевидения, которую он подрывает. Майкл Сноу раскладывает кинематограф на базовые элементы, но кино к тому времени существует уже более полувека. А вокруг нейросетей нет никакой индустрии. И к тому же мы находимся в мире, когда одновременно и интеллектуалы, и обыватели используют эти инструменты одновременно.
«Центральный регион,
1971
Джун Пайк
Вообще как обучаются сети в данный момент? Есть разные техники, но главная идея — собрать десятки миллиардов картинок из интернета и их текстовые описания. На примере этих миллиардов картинок и текстов компьютер усваивает ассоциации. Таким техникам на самом деле уже 20 лет, их сначала использовали в поисковых целях. Но затем пришла идея — а что если ввести новый текст? Тогда компьютер может сгенерировать новые картинки на примере тех, что уже знает. Эти новые изображения не состоят из кусочков прежних картинок, это не ремикс, не коллаж и не монтаж. Правильнее будет описать это словом «интерполяция»: у нас есть точка А, точка B, и вот создается нечто в промежутке между точками. Технология позволяет сгенерировать концепции и реальности, которых ранее не существовало. Вот принципиальное отличие, скажем, от фотографии, фиксирующей лишь то, что уже существует. Кроме того, сеть может выдать не только одну картину, но целую серию изображений или анимаций внутри того ассоциативного поля, что вы обозначили.
В каком-то смысле мы наблюдаем здесь разделение между формой и содержанием. Есть такие ресурсы, как Midlibrary, где тестируются и собираются в кластеры различные стили, за этим очень любопытно наблюдать. Хотя иногда происходят сбои — когда на запрос «хочу изображение в стиле такого-то художника» генерируется что-то совершенно непохожее. Когда я использую сети для создания работ в своем стиле, постоянно с этим сталкиваюсь. Не то чтобы мой стиль рисунка какой-то гениальный, просто немного другой.
Уже сейчас очевидно самое главное ограничение нейросетей — очень похожее на врожденный порок статистической науки — заметным будет лишь то, что популярно, стереотипично, а не наоборот.
Складывается ощущение, что с ChatGPT почти все играют по одним правилам и задают похожие запросы. Возможно, у вас есть на уме какие-то способы применения нейросетей, которые пока что не особенно практикуют, но в будущем именно они дадут любопытные результаты?
Сети уже умеют многое, но их ведь можно доучивать. Один русский художник, например, обучил нейросеть работам московских концептуалистов, так что у нее стали получаться очень интересные образцы. Люди уже активно дорабатывают алгоритмы, но это требует технической сноровки.
Можно просто пользоваться имеющимися инструментами без дополнительных настроек, придумывая интересные запросы, как это делаю я. Но у меня есть определенные референсы из биографии, которые в данный момент уникальны для Midjourney. Помню, как во время моей учебы в 80-е преподаватель приносил альбомы Джорджо Моранди и Роберта Фалька, на них я учился. От людей, которые сегодня пользуются сетями, это очень далеко. Так что благодаря моему образованию, знаниям в истории искусства я могу делать картинки, отличающиеся от того, что создает большинство. Если у вас есть знания и интересные идеи — это работает. Если вы знаете, что хотите сказать, то любой инструмент может пригодиться. Если нет — никакая технология не поможет.
Другое дело, что сети в каком-то смысле обесценивают историю искусств. Потому что теперь любой человек с хоть каким-то образованием может генерировать картины Поллока, Ван Гога или какие-нибудь fantasy novels. То, чему раньше вы должны были учиться много лет, достигается нажатием одной кнопки. Точно так же смартфоны обесценили фотографию. То, что в XX веке достигалось через усилия и страдания, теперь может сделать любой. Но остаются вершины. Рисовать как Рембрандт сегодня не может никто. Почему — непонятно. Казалось бы, в современном мире на миллион художников больше. Но ни сети, ни какой-нибудь художник из лучшей китайской академии не способен на такой результат.
Рисовать как Рембрандт сегодня не может никто. Почему — непонятно. Казалось бы, в современном мире на миллион художников больше. Но ни сети, ни какой-нибудь художник из лучшей китайской академии не способен на такой результат
В аннотации к вашей лекции упоминаются изменения, которые нейросети вносят в кураторские практики. Помогут ли нейросети и вообще новая цифровая среда взглянуть на мир шире и увидеть то, что раньше ускользало от ограниченных человеческими возможностями взглядов кураторов и зрителей?
Еще в 2005 году, когда в блогах появилась возможность прикреплять картинки, мне пришла в голову идея культурной аналитики. Я остро осознал, что заниматься искусствоведением больше не могу. Если раньше количество культурных объектов было ограничено, то сегодня их число стало неохватным. Тогда я задумался об использовании компьютерного зрения, методе data science, позволяющем обрабатывать массивы визуальных (и не только визуальных) культурных объектов и различать, как в них меняются форма и содержание со временем. Я создал лабораторию Software Studies Initiative, где мы в течение 14 лет занимались подобной работой. Затем выпустил книгу Cultural Analytics. Правда, по прошествии стольких лет я также осознал ограничения подобных методов. Но то же самое можно делать сегодня с Midjourney — разбивать массивы картинок на кластеры, выделять в них типичное и нетипичное, делать видимыми стереотипы и паттерны.
Еще сети можно использовать почти как «медицинский» инструмент. Скажем, студент или художник приносит свое портфолио, и мы проверяем — можно ли сгенерировать работы в таком стиле? Если да, значит, работы не уникальны. В области компьютерного зрения и data science уже разработаны методы, чтобы задавать такие вопросы и отвечать на них количественно. Так что нейронные сети — прекрасные инструменты культурного анализа. Пока что я не вижу подобного, но наверняка кто-то начнет этим заниматься. Прорабатывать информацию с точки зрения уникальности и типичности — вот одна из первых вещей, что приходит мне в голову.
Cultural Analytics
Еще сети можно использовать почти как «медицинский» инструмент. Скажем, студент или художник приносит свое портфолио, и мы проверяем — можно ли сгенерировать работы в таком стиле? Если да, значит, работы не уникальны. В области компьютерного зрения и data science уже разработаны методы, чтобы задавать такие вопросы и отвечать на них количественно. Так что нейронные сети — прекрасные инструменты культурного анализа
Мне как большому фанату книги «Изобретение повседневности» Мишеля де Серто запомнилась ваша фраза о том, что водитель Uber’а сегодня художник, изобретающий движение по городу. Серто тоже много писал о прогулках по городу, о переключении телеканалов как о маленьких нарушениях и практиках, позволяющих переосмыслить, перенастроить окружающее пространство и культуру. Можно ли сказать, что сегодня влияние этих микропрактик становится заметнее и ощутимее?
Говоря о Серто, стоит учитывать контекст времени, его взгляды были немного романтически левыми. Все эти идеи о власти, городе, который нас контролирует, на что пешеходы отвечают ускользанием, фланерством. Сегодня же мы наблюдаем другую ситуацию. Есть интернет, позволяющий любому на 15 секунд стать знаменитым, обратить на себя внимание или привлечь финансирование. В результате огромное количество людей изобретают какой-нибудь hack — например, использовать Midjourney особенным образом, чтобы добиться нетривиального результата. Они тут же это публикуют и пропагандируют. В то время как у компаний нет времени, чтобы точечно следить за каждым из миллионов юзеров. А юзеры, в свою очередь, пытаются конкурировать с компаниями, превратить свои маленькие находки в личный бизнес, так что происходит ироническая инверсия того, о чем писал Серто.
Я, как человек, выросший в позднем советском обществе, лишен романтизированного отношения к подобным практикам как к единственно спасительным. Мне кажется, что инновации и изменения могут возникнуть в любой среде, внутри тех же больших компаний. Вот сотрудники компании изобрели какую-то новую фичу, хотят ее внедрить, им кажется, что она изменит мир. А отдел маркетинга блокирует их работу, и они начинают внутреннюю борьбу. То есть компания — это такой город, где у каждого обитателя есть не только стратегии, но и тактики. Город, внутри которого все пытаются ускользнуть, придумать что-то особенное. Идея о том, что компании существуют только ради заработка, — бред. Многие люди в бизнесе заряжены страстью, сравнимой со страстью художников. Человек, придумавший Google Maps, совершил нечто не менее инновационное, чем какой-нибудь знаменитый художник. Мне кажется, что ни у компаний, ни у свободных художников нет монополии на инновации.
«Изобретение повседневности, Мишель де Серто
Но возвращаясь к Серто — он пишет о городе, о hardware. СССР был прекрасным примером подобного пространства, где люди вынуждены постоянно просачиваться через какие-то преграды, заборы, практиковать самиздат, придумывать какие-то хаки. В отличие от капитализма, где вы можете спокойно и уютно жить, особенно ничего не изобретая. Сегодня, в мире софта, в мире интернета, пишешь программку, и уже через час ею пользуются миллионы людей. Интернет — это самиздат-система, где инновации могут расходиться мгновенно, особенно если это open-source. Такое пространство par excellence для разнообразных стратегий, но стратегии эти не обязательно подрывают систему, они могут быть нацелены и просто на принесение прибыли.
Интернет — это самиздат-система, где инновации могут расходиться мгновенно, особенно если это open-source. Такое пространство par excellence для разнообразных стратегий, но стратегии эти не обязательно подрывают систему, они могут быть нацелены и просто на принесение прибыли
Не могу не задать один предельно общий и слегка наивный вопрос — с новыми цифровыми технологиями движемся ли мы скорее в сторону децентрализации и демократизации или к контролю и унификации желаний?
Тут ведь дело не в самих технологиях, а во взаимодействии с другими факторами. Есть процесс глобализации, продолжающийся уже 30 лет, но сейчас движущийся в обратном направлении. Или фактор англизации, появившийся только в 90-е. Падение Советского Союза и изобретение веба случаются в одно и то же время, и в этом совпадении есть свой символизм и смысл. Культура с того времени становится глобальной, все западные идеи и концепции современного искусства приходят в страны, где раньше ничего подобного не существовало. Так же интернет, софт, Photoshop становятся неким глобальным культурным языком, на котором говорят по всему миру. Возникает вопрос — эти технические возможности, связанные с доступностью информации, доступностью перемещений по миру, — делают ли они мировую культуру более богатой? Google или YouTube — подталкивают ли они нас к разнообразию или к тому, что мы смотрим одни и те же вещи? Крупные компании периодически отчитываются о проведенных исследованиях — скажем, Spotify недавно рассказывали, что в среднем разнообразие музыкальных вкусов их пользователей растет. Но это лишь одно исследование, ограниченное в своих методах. Может быть, растет разнообразие исполнителей, но уменьшается разнообразие стилей? У меня лично складывается ощущение, что за последние 10–15 лет не то чтобы формируется какая-то монокультура, но разнообразие теряется. Все эти топ-10 и списки лучшего... Та же Midjourney позволяет реализовать очень разные задумки, но 99% людей обходятся пятью типами стилей.
Или бренды. Еще 15 лет назад они не были такими важными, как сегодня. Но в мире бесконечных возможностей люди все чаще начинают обращаться к брендам, потому что это какие-никакие ориентиры. Происходит битва за воображение аудитории. В интернете ты ищешь и наблюдаешь, что люди лайкают, а что нет. И образуешь вокруг себя маленькие сообщества по образцам сообществ больших. Но если взглянуть на науку, то мы обнаружим десятки тысяч непохожих сообществ, а если вернемся в сферу искусства — всего лишь 5–7 главных направлений. Мы делаем проекты про экологию, про GPT, про равенство. А идеалы модернизма — нюанс, противоречие, многозначность — выходят из моды. Конечно, их еще можно отыскать, но с большей вероятностью где-нибудь в сфере дизайна, а не в музее и искусстве, которое все чаще становится пропагандистским. Возможно, потому что сегодня никто не хочет оставаться в андеграунде, все хотят урвать кусок пирога, хотят, чтобы их пригласили в MoMA, Apple или ЮНЕСКО. Происходит демократизация общества, но в результате очень часто люди, которым кажется, что они выражают оппозиционные идеи, на самом деле становятся проводниками самых обыкновенных и усредненных концепций.
Мы делаем проекты про экологию, про GPT, про равенство. А идеалы модернизма — нюанс, противоречие, многозначность — выходят из моды. Конечно, их еще можно отыскать, но с большей вероятностью где-нибудь в сфере дизайна, а не в музее и искусстве, которое все чаще становится пропагандистским
Могу заметить и по себе, что в нынешнем океане информации не хватает сил придумать какой-то свой, индивидуальный принцип навигации в ней.
Да, возникает ощущение разнообразия, но в интернете, как в Midhourney, — что-то представлено в миллионе копий, а что-то отсутствует вовсе. У старой системы библиотеки все-таки были свои преимущества, потому что количество информации было не столь объемным, а нас это побуждало на активность. Сейчас мы все устали и вместо того, чтобы искать какое-то особенное арт-кино, скорее всего, просто откроем YouTube. Вроде бы не то же самое, что смотреть телевизор, но зачастую очень похоже — разве что на ТВ повторяется один и тот же сюжет, а в трендах YouTube крутится c десяток мотивов.
И последний неизбежный вопрос — что вы можете сказать про будущее нейросетей, вектор их развития и возможные неожиданные траектории?
Знаете, я очень боялся открывать Midjourney пятой версии. Вчера впервые открыл. Какие-то вещи стали сложнее, стало ясно, что это не линейная эволюция, не так что каждый месяц все становится просто совершеннее. Еще любопытно, что AI ведь не знает, что он делает, а просто отрабатывает ассоциации между словами, но при этом успешно создает иллюзию связности и знания. То, что мы легко поддаемся на эту иллюзию, — много говорит о нас.
Будущее, конечно, несет изменения, но оно будет намного больше похоже на настоящее, чем нам кажется. Мы продолжим ходить на работу, в пиджаках будут все те же карманы для платков, которые уже 200 лет никто не носит с собой, но инерция не позволяет им исчезнуть. Да, в условиях демократизации медиа элитная культура, основанная на нюансах, пропадает. С другой стороны, если посмотреть на другие сферы, скажем, на food culture — за 20 лет произошла настоящая революция. Огромное количество людей наслаждается прекрасной едой, прежде доступной только элитам. А в искусстве, наверное, и так было сделано все, что возможно. Есть другие области культуры, куда приходит богатство и разнообразие.
Будущее, конечно, несет изменения, но оно будет намного больше похоже на настоящее, чем нам кажется. Мы продолжим ходить на работу, в пиджаках будут все те же карманы для платков, которые уже 200 лет никто не носит с собой, но инерция не позволяет им исчезнуть
24 МАРТА 2023
0