Цитата(Fun)
берем OpenAI, ставим ему задачу натренировать 30минутный разговор, получаем прохождение теста.
Я тут написал огромный пост, и вдруг осознал важный момент, почему мы спорим.
Ты говоришь о реально существующем ныне тесте Тьюринга, который предназначен для проверки, насколько ИИ хороши в имитации людей (назовем это целью
а). Участие ИИ совершенно очевидно для экспериментаторов и неочевидно только для судьи. Этот тест Тьюринга будет постоянно совершенствоваться, пока будут совершенствоваться ИИ. OpenAI, возможно, и прошел тест, но надо же как-то тестировать языковые модели следующего поколения, значит, будут определены новые критерии, как ты говоришь, человекоподобности. Этот тест Тьюринга сильно зависит от судей (их образования и знания, на что способны современные ИИ, и т.д.) и будет применяться в своих уточняющихся формах до тех пор, пока ИИ не станут сильными (будут ли они обладать сознанием или являться китайскими комнатами, неизвестно)
Первые чат-боты, которые появлялись, тоже в свое время поражали воображение. Человек с улицы мог бы подумать, что он разговаривает с настоящим человеком - потому что у него просто в голове не укладывается, что алгоритмы способны на то, чтобы распознавать речь и отвечать на нее, пусть и криво. Что мы имеем? Прохождение теста Тьюринга, но весьма ограниченное. Созданное вау-эффектом. И имеющее рекламную цель. Теперь у нас есть генераторы текстов, способные запоминать огромную базу данных. Но и мы уже привыкли к прошлым чат-ботами, и тут вдруг такой разительный прорыв. Люди опять поражены.
Но и GPT проходит лишь ограниченный тест Тьюринга. Его можно натренировать, обучить, но шаг в сторону - и ты увидишь аномалию. GPT - это не операционка из фильма "Она", это довольно глупая штука, которая свою искусственность выдает сразу, если разговор заходит не туда. На Хабре есть статьи, где пользователи проверяли эту языковую модель, и она начинала выдавать перлы.
Ну написала она статьи, ну обманулись люди, прочитав их. И что это доказывает?. Тут даже классический тест Тьюринга не пройден, он ведь подразумевает непосредственное взаимодействие с ИИ. Очередной рекламный вау-эффект.
Простая жительница Бердянска тетя Нюра будет впечатлена - для нее тест Тьюринга будет пройден. Человек, который знает, как работают ИИ, на что они способны и какие недостатки имеют, на вау-эффект не купится, он свою проверку выстроит по другому. Он будет как профессиональный тестировщик.
В Кукушке на самой деле фантастический тест Тьюринга в том смысле, что он применяется для охоты на ИИ (цель
б), то есть неизвестно никому, есть ли ИИ среди испытуемых. В мире рассказа априори эти ИИ не являются сильными, поскольку иначе бы их эмпирическая проверка не была бы возможной в принципе, но они уже довольно человекоподобные. Значит, это тот самый последний возможный тест Тьюринга (самый строгий и дотошный), который предшествует появлению сильного ИИ (кукушонка?) или где-то рядом с этим. Явно этот тест будут проводить самые крутые эксперты, а форма диалога может быть совершенно специфической и отличаться от обычного диалога (может, это будут цитаты из Набокова
). При этом специалисты будущего могут совершенно справедливо считать, что это тот самый классический тест Тьюринга, который никто еще не прошел, как сейчас мы называем классическим тестом Тьюринга лишь одну из интерпретаций того, о чем писал сам Тьюринг.
Но тут я соглашусь, существует момент, к которому каждый выбирает сам как относится. Проведение теста Тьюринга просто выглядит быстрой экспресс-проверкой, за которым следуют подтверждающие тесты. Наконец, сама героиня и заявляет, что ей, как специалисту, достаточно общения с Рахиль, это ведь тоже своего рода эмпирический тест. Тут Офис повсюду выглядит как сборище не слишком компетентных и инертных бюрократов, и промедление со слепком это доказывает. Да еще и тест Тьюринга сам по себе допотопный, слепой, атавистический, будто он до сих пор служит цели
а. Зачем нужны экраны, если и так непонятно, а есть ли ИИ вообще среди испытуемых. Мимика, эмоциальная реакция, жесты идут мимо, а они для охотника могут быть важны. Поэтому тест Тьюринга в мире рассказа формальность, он малоинформативен, потому что он (и его безошибочность) всегда должен подтверждаться другими тестами. Но вот эта вот его преемственность из прошлого - она прям бьется с общей бюрократичностью и стереотипным складом ума начальников Офиса. Имхо.
Цитата(Fun)
Пример с OpenAI это по факту и есть китайская команта
По факту, китайская комната - это критика существования сознания у сильного ИИ. OpenAI не является сильным ИИ.
Я понимаю, что ты хочешь сказать, но китайской комнатой в таком случае можно назвать любой робот-пылесос, который какой-нибудь абориген из Амазонии посчитает разумным и преисполненным духами предков (то есть типа пройден тест Тьюринга).
А мне не нравится такая вырожденность этого крутого термина, сорян)
Блин, опять огромный пост.