Сегодня 14 декабря, суббота ГлавнаяНовостиО проектеЛичный кабинетПомощьКонтакты Сделать стартовойКарта сайтаНаписать администрации
Поиск по сайту
 
Ваше мнение
Какой рейтинг вас больше интересует?
 
 
 
 
 
Проголосовало: 7277
Кнопка
BlogRider.ru - Каталог блогов Рунета
получить код
Валентин Урбан: aby se napít, známky a extáze
Валентин Урбан: aby se napít, známky a extáze
Голосов: 1
Адрес блога: http://dubva1.livejournal.com/
Добавлен: 2008-08-04 10:21:30 блограйдером pinker
 

Чувственный способ

2011-11-04 20:16:03 (читать в оригинале)

Над созданием языкового интерфейса для действенного голосового управления автоматикой ученые бьются не 1-ый десяток лет. Производительность вычислительных устройств выросла в млрд раз, но в сфере осознания и производства речи успехи компов более чем умеренны. Новенькая концепция, основанная на «эффекте сопереживания», представляется хорошим выходом из технологического тупика.





Стандартный подход к конструированию языковых интерфейсов рассматривает процесс общения как цепь поочередных преобразований: начальный смысл сообщения, родившийся в мозгу говорящего, перерабатывается им более либо наименее связный текст, после этого адресат сообщения производит оборотное действие, другими словами конвертирует речь в смысл. Заметим, что 2-ая процедура на порядки труднее первой – прочитать газетную статью и извлечь из нее некоторый смысл существенно легче, чем написать газетную статью, другими словами оформить некоторый начальный смысл в виде связного текста. Вот поэтому обучить машины гласить еще неизмеримо сложнее, чем обучить их различать языковые команды.


Лингвистика подразумевает, что на теоретическом уровне оба эти процесса можно обрисовать полностью формально и исчерпывающе, после этого их можно будет точно воспроизвести машинными способами. Правда, снабдить машину работающими преобразователями типа «смысл-речь» и «речь-смысл» недостаточно, она еще должна уметь создавать тот смысл, который необходимо выразить через речь. Другими словами, машину необходимо обучить мыслить, и как это сделать – пока совсем непонятно. Вот поэтому создание настоящего языкового интерфейса как и раньше отодвинуто на совсем неопределенный срок, при всем этом некие специалисты считают, что в рамках применяемых сейчас способов эта задачка может и совсем не иметь решения.


Доктор Роджер Мур (Roger Moore) предложил альтернативную концепцию языкового интерфейса, предполагающую активное внедрение эмпатии для анализа и генерации речи. Сущность подхода состоит в том, что машина вроде бы ставит себя на место говорящего с ней человека, чтобы попробовать реконструировать его желания, чувства, мотивы и текущие задачки – весь контекст, в каком происходит выражение. Смысл получаемого сообщения (и более адекватный ответ самого компьютера), выводится, исходя из особенностей ситуации, в которую погружен говорящий. Концепция получила заглавие PRESENCE («Присутствие»).


Объясняет сам Роджер Мур: «Основное различие меж PRESENCE и классическими подходами к языковым интерфейсам заключается в последующем. Во-1-х, PRESENCE соединяет воединыжды процессы определения и генерации речи, что позволяет уменьшить количество анализируемых характеристик и, в конечном счете, оборачивается значимым понижением вычислительной нагрузки. Во-2-х, этот подход связывает воедино относительно примитивную деятельность по техническому анализу речи с высокоуровневой познавательной деятельностью. Благодаря этим особенностям интерфейсы, основанные на PRESENCE, должны быть еще эффективнее обычных систем, которые агрессивно делят процесс генерации и определения речи и поэтому испытывают колоссальные трудности при попытке соединить их в единое непротиворечивое целое».


Концепция Мура базируется на последних достижениях в области нейробиологии – таких, как описание коммуникативных стратегий, общих для всех живых систем, и выделении когнитивных возможностей, характерных только человеку и никому больше. Хотя к лингвистике все это имеет только косвенное отношение, приобретенные результаты могут быть удачно применены для сотворения языковых систем принципно нового типа.


«Ключевым положением PRESENCE, - комментирует доктор Мур, - является тот факт, что в базе поведения лежат сокрытые убеждения, желания и намерения. Отсюда следует, что если одна система интерпретирует поведение другой, главным фактором будет то, как конкретно 1-ая система осознает убеждения, желания и намерения 2-ой. Другими словами, смысл выводится из контекста. Одна особь может составить полностью адекватное представление о действии другой особи благодаря тому, что сама способна совершить нечто схожее. В этом и заключается сущность эмпатических либо зеркальных отношений, возникающих меж представителями 1-го био вида».


В рамках подготовительных исследовательских работ команда Мура сделала гуманоидного бота АLPHA REX, использующего принципы PRESENSE для решения относительно обычный задачки по синхронизации собственных действий с действиями человека. Бот показал полностью достойные результаты.


Если человек произносит «раз, два» с постоянными интервалами, бот начинает хлопать в ладоши. Очень обычная цепь контроля принуждает бота поменять темп хлопков до того времени, пока он не совпадет с темпом людской речи. Высочайшая степень синхронизации достигается уже на восьмом хлопке – а стандартные способы решения схожей задачки востребовали бы от бота массы сложных логических операций, требующих неизмеримо огромных вычислительных мощностей. Так как бот действует, основываясь на прогнозе поведения человека, после окончания счета он «по инерции» совершает один излишний хлопок – совершенно так, как это сделали бы мы.


Конкретно способность к оперативной синхронизации, реагированию и прогнозированию, продемонстрированная роботом АLPHA REX (пускай на очень простом уровне) является краеугольным камнем модели PRESENCE. Как объясняет Роджер Мур, идет речь не сколько о распознавании речи, сколько о новеньком способе взаимодействия машины и человека.


Что касается определенных сроков широкого внедрения языковых интерфейсов, Мур отмечает последующее: «Языковые интерфейсы сумеют соперничать с классическими устройствами ввода не ранее, чем их способность распознавать речь достигнет половины от того уровня, который показывают сами люди. Сейчас их уровень приблизительно в 5 раз ниже этого минимума. Сколько времени пригодится им, чтоб устранить этот разрыв? Если нам получится поддерживать те же темпы развития, что наблюдались в течение последнего десятилетия – около 20 лет».


В то же время, другие исследователи лицезреют будущее нашего взаимодействия с компьютерами в виде нейросетей («По виду и подобию»), а некие разрабатывают интерфейс, способный конкретно принимать «мысли» («Мыслю – как следует, управляю»).


По инфы Physorg.Com









 


Самый-самый блог
Блогер ЖЖ все стерпит
ЖЖ все стерпит
по количеству голосов (152) в категории «Истории»


Загрузка...Загрузка...
BlogRider.ru не имеет отношения к публикуемым в записях блогов материалам. Все записи
взяты из открытых общедоступных источников и являются собственностью их авторов.