» » Игры кончились: AlphaGo займется решением реальных мировых проблем

Игры кончились: AlphaGo займется решением реальных мировых проблем

Игры кончились: AlphaGo займется решением реальных мировых проблем
В былом месяце человечество продуло важную битву с ненастоящим интеллектом — тогда AlphaGo обставил чемпиона по го Ки Дже со счетом 3:0. AlphaGo — это программа с ненастоящим интеллектом, разработанная DeepMind, частью родительской братии Google Alphabet. В былом году она обставила иного чемпиона, Ли Седоля, со счетом 4:1, однако с тех пор существенно набрала по очкам.

Ки Дже живописал AlphaGo будто «бога игры в го».
Теперь AlphaGo заканчивает играть в игры, предоставляя возможность игрокам, будто и прежде, биться между собой. Ненастоящий интеллект завел статус «игрока из дальнего будущего», до уровня какого людам придется вырастать очень длительно.

На старт, внимание, го


Го — это древняя игра на двоих, где один-одинехонек играет белокипенными фигурами, иной черными. Задача — захватить доминацию на доске, поделенной на 19 горизонтальных и 19 вертикальных линий. Компьютерам играть в го сложнее, чем в шахматы, потому что число возможных ходов в всякой позиции намного вяще. Это делает просчет возможных ходов наперед — вполне вероятный для компьютеров в шахматах — очень сложным в го.
Прорывом DeepMind стала разработка всеобщего алгоритма обучения, какой, в принципе, можно направить в более социально ориентированном течении, чем го. DeepMind говорит, что группа исследователей AlphaGo пробует решить сложные проблемы вроде розыска новых лечений для заболеваний, радикального снижения энергопотребления или разработки новых революционных материалов.
«Если система ИИ доказывает, что способна обретать новоиспеченное знание и стратегии в этих сферах, прорывы будут попросту неописуемы. Не могу дождаться, чтобы увидеть, что будет дальше», говорит один-одинехонек из ученых проекта.
В предбудущем это грозит силом захватывающих возможностей, однако проблемы доколе никуда не делись.

Нейробиология и ненастоящий интеллект


AlphaGo сочетает две мощных идеи на тему обучения, какие получили развитие за заключительные несколько десятилетий: абсолютное обучение и обучение с подкреплением. Что примечательно, оба течения вышли из биологической концепции работы и обучения мозга в процессе получения эксперимента.
В мозге человека сенсорная информация обрабатывается в серии пластов. Например, визуальная информация сперва трансформируется в ретине, затем в посредственном мозге, а затем проходит сквозь неодинаковые области коры головного мозга.
В итоге показывает иерархия представений, где сперва идут простые и локализованные детали, а затем более сложные и комплексные особенности.
Эквивалент в ИИ зовется абсолютным обучением: абсолютное, потому что включает бездна пластов обработки в простых нейроноподобных вычислительных единицах.
Однако чтобы выжить в этом мире, звериным необходимо не всего распознавать сенсорную информацию, однако и действовать в соответствии с ней. Поколения ученых и психологов исследовали, будто звериные занимаются предпринимать деяния, чтобы максимизировать извлекаемую выгоду и получаемую награду.
Все это ввергло к математическим теориям обучения с подкреплением, какое теперь можно имплементировать в системы ИИ. Самой величавой из них изображает настолько величаемое TD-обучение, какое улучшает деяния за счет максимизации ожидания предбудущей награды.

Важнейшие ходы


Игры кончились: AlphaGo займется решением реальных мировых проблем
За счет сочетания абсолютного обучения и обучения с подкреплением в серии искусственных нейронных сетей, AlphaGo сперва научился играть на уровне профессионального игрока в го на основе 30 миллионов ходов из игр между людами.
Однако затем он взялся играть против себя, используя исход всякой игры, чтобы неумолимо оттачивать собственные решения о важнейшем ходе в всякой позиции на доске. Система ценностей сети научилась прогнозировать вероятный результат с учетом любой позиции, а система благоразумия сети научилась принимать важнейшее решение в всякой конкретной ситуации.
Алкая AlphaGo не мог опробовать все вероятные позиции на доске, нейронные сети извлекли ключевые идеи о стратегиях, какие важнецки работают в любой позиции. Собственно эти бесчисленные часы самостоятельной игры ввергли к улучшению AlphaGo за завершающий год.
К сожалению, доколе еще нет знаменитого способа выяснить у сети, что это за ключевые идеи. Мы попросту можем изучать игры и гадать, что что-то извлечем из них. Это одна из проблем использования нейронных алгоритмов: они не объясняют свои решения.
Мы по-прежнему капля соображаем о том, будто обучаются биологические мозги, а нейробиология продолжает предоставлять новоиспеченные ключи наития для ИИ. Люд могут стать экспертами в игре го, руководствуясь гораздо меньшим экспериментом, чем надобен AlphaGo для достижения такового уровня, поэтому пространство для улучшения алгоритмов еще есть.
Кроме того, большущая часть мощности AlphaGo основана на технике метода возвратного распространения оплошки, какая помогает ей исправлять оплошки. Однако связь между ней и обучением в реальном мозге доколе неотчетлива.

Что отдаленнее?


Игра го стала покойной платформой разработки для оптимизации этих алгоритмов обучения. Однако многие проблемы реального мира куда сбивчивее и имеют крохотнее возможностей для самообучения(например, самоуправляемые автомобили).
Существуют ли проблемы, к каким мы можем применить водящиеся алгоритмы?
Одним из образцов может быть оптимизация контролируемых промышленных обстоятельств. Здесь задача дробно состоит в том, чтобы выполнить сложную серию заданий, удовлетворить бездна критериев и минимизировать затраты.
До тех пор, доколе обстановка можно будет аккуратно смоделировать, эти алгоритмы будут заниматься и набираться эксперимента бойче и эффективнее, чем люд. Можно лишь повторить слова братии DeepMind: очень охота посмотреть, что же будет отдаленнее.
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.

комментариев

Свежие новости

08:00
«Много ошибок у Головкина». Российский боксер озвучил свой вердикт боя GGG — «Канело»
08:00
«Канело» определился с датой возвращения на ринг после победы над Головкиным
08:00
Трансляции пяти матчей 27-го тура Премьер-Лиги
05:30
Автосоревнования в честь закрытия внедорожного сезона пройдут в Благовещенске 22 сентября
05:30
Автоспорт в Хабаровске: анонс на 22-23 сентября
04:30
Котировки букмекеров на две игры ВХЛ с участием клубов из Казахстана
04:30
«Еркебулан — клевый пацан!». Девушки из «Уфы» спели Сейдахмету песню
04:30
Мексиканский телеканал определил место Головкина в P4P-рейтинге после первого поражения
04:00
Редактирование РНК может стать следующим этапом развития CRISPR
03:30
Певица Рианна назначена послом Барбадоса
02:30
«Работал на авторынке». Видео большого интервью Еркебулана Сейдахмета
02:30
Эксперт ESPN подтвердил плохие новости о втором бое Головкин — «Канело»
02:30
Инсайдер раскрыл новую информацию о третьем бое Головкин — «Канело»
01:30
Аргентина зафиксировала «важный сигнал» при поиске подлодки «Сан-Хуан»
00:30
Новый телескоп TESS за два дня обнаружил две новые землеподобные экзопланеты
00:30
В лаборатории впервые вырастили ткани пищевода
00:30
Экспериментальная иммунотерапия ВИЧ прошла первый этап испытаний безопасности
00:21
Что ждет лайткоин в будущем
00:13
Как грамотно подобрать чехол для своего смартфона?
00:10
Зоотовары, которые пригодятся каждому владельцу кошки
23:00
Главред The Ring вступился за Головкина после его поражения «Канело»
23:00
«Мне уже надоело». Сейдахмет сделал признание о сравнении с Месси
23:00
«Хочется в Англию». Сейдахмет рассказал, где хотел бы поиграть
22:31
Подозреваемый в убийстве девушек в Петрозаводске признал вину
22:30
В Нью-Йорке вооружённая ножом женщина напала на детский сад
22:30
В мурманской школе дети отравились ядовитой приманкой для грызунов
22:30
В горах Карачаево-Черкессии три туриста попали в трещину на леднике
22:00
Симоньян ждет фотографии Петрова и Боширова с Солсберийским собором
21:30
«Роснефть» начала промышленный выпуск нового высококачественного бензина
21:30
Эксперты объяснили поведение вкладчиков, массово снимающих валюту со счетов
21:00
Ищете доступную альтернативу Google Pixel? Этот смартфон — ваш выбор
21:00
Почему не стоит покупать Xiaomi Mi Band 3 с поддержкой NFC
20:31
Японский зонд «Хаябуса-2» высадил на астероид Рюгу два ровера
20:30
Гибель клеток головного мозга остановит… паучий яд
20:30
Видео: эффектные краш-тесты электрокара Tesla Model 3
20:00
«Алматы» по буллитам обыграл «Арлан» в матче чемпионата РК
20:00
Хопкинс считает, что Чарло не заслужил поединка с победившим Головкина Альваресом
20:00
Игроки «Астаны» не вошли в символическую сборную первого тура Лиги Европы УЕФА
19:30
Команда инженеров Toyota Supra перестала общаться с BMW еще в 2014 году
19:30
Автоспорт в Грозном: анонс на 22-23 сентября
Больше новостей