» » Игры кончились: AlphaGo займется решением реальных мировых проблем

Игры кончились: AlphaGo займется решением реальных мировых проблем

Игры кончились: AlphaGo займется решением реальных мировых проблем
В былом месяце человечество продуло важную битву с ненастоящим интеллектом — тогда AlphaGo обставил чемпиона по го Ки Дже со счетом 3:0. AlphaGo — это программа с ненастоящим интеллектом, разработанная DeepMind, частью родительской братии Google Alphabet. В былом году она обставила иного чемпиона, Ли Седоля, со счетом 4:1, однако с тех пор существенно набрала по очкам.

Ки Дже живописал AlphaGo будто «бога игры в го».
Теперь AlphaGo заканчивает играть в игры, предоставляя возможность игрокам, будто и прежде, биться между собой. Ненастоящий интеллект завел статус «игрока из дальнего будущего», до уровня какого людам придется вырастать очень длительно.

На старт, внимание, го


Го — это древняя игра на двоих, где один-одинехонек играет белокипенными фигурами, иной черными. Задача — захватить доминацию на доске, поделенной на 19 горизонтальных и 19 вертикальных линий. Компьютерам играть в го сложнее, чем в шахматы, потому что число возможных ходов в всякой позиции намного вяще. Это делает просчет возможных ходов наперед — вполне вероятный для компьютеров в шахматах — очень сложным в го.
Прорывом DeepMind стала разработка всеобщего алгоритма обучения, какой, в принципе, можно направить в более социально ориентированном течении, чем го. DeepMind говорит, что группа исследователей AlphaGo пробует решить сложные проблемы вроде розыска новых лечений для заболеваний, радикального снижения энергопотребления или разработки новых революционных материалов.
«Если система ИИ доказывает, что способна обретать новоиспеченное знание и стратегии в этих сферах, прорывы будут попросту неописуемы. Не могу дождаться, чтобы увидеть, что будет дальше», говорит один-одинехонек из ученых проекта.
В предбудущем это грозит силом захватывающих возможностей, однако проблемы доколе никуда не делись.

Нейробиология и ненастоящий интеллект


AlphaGo сочетает две мощных идеи на тему обучения, какие получили развитие за заключительные несколько десятилетий: абсолютное обучение и обучение с подкреплением. Что примечательно, оба течения вышли из биологической концепции работы и обучения мозга в процессе получения эксперимента.
В мозге человека сенсорная информация обрабатывается в серии пластов. Например, визуальная информация сперва трансформируется в ретине, затем в посредственном мозге, а затем проходит сквозь неодинаковые области коры головного мозга.
В итоге показывает иерархия представений, где сперва идут простые и локализованные детали, а затем более сложные и комплексные особенности.
Эквивалент в ИИ зовется абсолютным обучением: абсолютное, потому что включает бездна пластов обработки в простых нейроноподобных вычислительных единицах.
Однако чтобы выжить в этом мире, звериным необходимо не всего распознавать сенсорную информацию, однако и действовать в соответствии с ней. Поколения ученых и психологов исследовали, будто звериные занимаются предпринимать деяния, чтобы максимизировать извлекаемую выгоду и получаемую награду.
Все это ввергло к математическим теориям обучения с подкреплением, какое теперь можно имплементировать в системы ИИ. Самой величавой из них изображает настолько величаемое TD-обучение, какое улучшает деяния за счет максимизации ожидания предбудущей награды.

Важнейшие ходы


Игры кончились: AlphaGo займется решением реальных мировых проблем
За счет сочетания абсолютного обучения и обучения с подкреплением в серии искусственных нейронных сетей, AlphaGo сперва научился играть на уровне профессионального игрока в го на основе 30 миллионов ходов из игр между людами.
Однако затем он взялся играть против себя, используя исход всякой игры, чтобы неумолимо оттачивать собственные решения о важнейшем ходе в всякой позиции на доске. Система ценностей сети научилась прогнозировать вероятный результат с учетом любой позиции, а система благоразумия сети научилась принимать важнейшее решение в всякой конкретной ситуации.
Алкая AlphaGo не мог опробовать все вероятные позиции на доске, нейронные сети извлекли ключевые идеи о стратегиях, какие важнецки работают в любой позиции. Собственно эти бесчисленные часы самостоятельной игры ввергли к улучшению AlphaGo за завершающий год.
К сожалению, доколе еще нет знаменитого способа выяснить у сети, что это за ключевые идеи. Мы попросту можем изучать игры и гадать, что что-то извлечем из них. Это одна из проблем использования нейронных алгоритмов: они не объясняют свои решения.
Мы по-прежнему капля соображаем о том, будто обучаются биологические мозги, а нейробиология продолжает предоставлять новоиспеченные ключи наития для ИИ. Люд могут стать экспертами в игре го, руководствуясь гораздо меньшим экспериментом, чем надобен AlphaGo для достижения такового уровня, поэтому пространство для улучшения алгоритмов еще есть.
Кроме того, большущая часть мощности AlphaGo основана на технике метода возвратного распространения оплошки, какая помогает ей исправлять оплошки. Однако связь между ней и обучением в реальном мозге доколе неотчетлива.

Что отдаленнее?


Игра го стала покойной платформой разработки для оптимизации этих алгоритмов обучения. Однако многие проблемы реального мира куда сбивчивее и имеют крохотнее возможностей для самообучения(например, самоуправляемые автомобили).
Существуют ли проблемы, к каким мы можем применить водящиеся алгоритмы?
Одним из образцов может быть оптимизация контролируемых промышленных обстоятельств. Здесь задача дробно состоит в том, чтобы выполнить сложную серию заданий, удовлетворить бездна критериев и минимизировать затраты.
До тех пор, доколе обстановка можно будет аккуратно смоделировать, эти алгоритмы будут заниматься и набираться эксперимента бойче и эффективнее, чем люд. Можно лишь повторить слова братии DeepMind: очень охота посмотреть, что же будет отдаленнее.
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.

комментариев

Свежие новости

12:30
Госдума рассмотрит возможность введения вкладов без права снятия денег
11:30
Asus выпустила гарнитуру смешанной реальности HC102
10:30
Хабаровчанка отсудила у «Роснефти» более 70 тысяч рублей за некачественный бензин
10:30
Жителям Хабаровска придется смириться с утренними пробками на подъезде к аэропорту
10:02
Андухар одержал первую победу в АТР за 2 года
10:02
Алина Загитова: Конкуренция подстегивает, но мы с Медведевой в первую очередь подруги
10:02
Наоми Осака: Я очень быстро учусь, но при этом очень быстро забываю. Приходится много тренировать мозги
10:02
Daily Mail: английский производитель энергетических напитков может купить Форс-Индию
10:02
Йоханна Конта: На корте есть определенный элемент актерства
10:02
Мария Сотскова: Недовольна своим выступлением, в произвольной буду бороться до последнего
10:01
Гарбинье Мугуруса: С годами я поняла, что важны не только Большие шлемы, но и турниры WTA
10:01
Олимпиада-2018. Лыжи. Спицов и Большунов выступят в командном спринте
10:01
Олимпиада-2018. Загитова выйдет на лед с произвольной программой до Медведевой
10:01
НБА. Бывший президент Мэверикс обвиняется в сексуальных домогательствах
09:00
Ведущая Екатерина Андреева заявила, что ее "Время" закончиться не может
08:01
Министр образования Украины обвинила министра иностранных дел Венгрии во лжи
07:02
Монтелла - Чтобы остановить Санчеса, возможно, придется его убить!
07:02
НХЛ. "Нэшвилл" Емелина обыграл "Детройт"
07:02
НХЛ. Тарасенко и Барбашев забросили "Шаркс". Видео
07:02
НБА. Яннис Адетокумбо: Проблемы с коленом возникли из-за того, что я очень много играю
07:02
Олимпиада-2018. Скоростной спуск. Годжиа выиграла, Мувинкель 2-я, Вонн 3-я
07:02
Олимпиада-2018. 21 февраля. Все медали дня
07:01
Олимпиада-2018. Норвегия лидирует в общем зачете, у России 11 медалей
07:01
НБА. Малик Монк попал в аварию и был оштрафован за неосторожное вождение
07:01
Тренер российских керлингисток: Опасаюсь, что фармакологический терроризм войдет в тренд
07:01
НХЛ. "Лос-Анджелес" прервал победную серию "Виннипега"
06:30
В Москве пройдет судебный процесс по делу о плагиате в песне Киркорова
06:30
Росстат: с Украины в РФ переехало более 600 тысяч человек
05:01
Владимир Аликин: Даже Фуркад ведет себя скромнее, чем Бабиков
05:00
Серена без предупреждения посетила детский просмотр фильма о черном супергерое
05:00
ФИФА может не допустить сборную Саудовской Аравии на ЧМ из-за конфликта с Катаром
05:00
НБА. Тобайас Харрис и Бобан Марьянович показали свое приветствие
05:00
Паулу Фонсека: У команд из лиг, которые прерываются на зиму, результаты не совсем утешительные
05:00
Александр Крушельницкий: У нас есть версия. Озвучивать будем ее только в рамках расследования
05:00
Защитник Бешикташа Вида удален на 16-й минуте игры с Баварией за фол на Левандовском
04:30
Вячеславу Лебедеву нужны следственные судьи
04:30
Избирательные участки Москвы украсят ради повышения явки
04:00
В Краснодарском крае задержали автобус с 33 обезьянами
03:31
НБА. Девушка из твиттера по-прежнему хочет встретиться со Стивеном Адамсом
03:31
Богдан Бутко: Если Шахтер выиграет ЛЧ, я побреюсь налысо
Больше новостей