» » Игры кончились: AlphaGo займется решением реальных мировых проблем

Игры кончились: AlphaGo займется решением реальных мировых проблем

Игры кончились: AlphaGo займется решением реальных мировых проблем
В былом месяце человечество продуло важную битву с ненастоящим интеллектом — тогда AlphaGo обставил чемпиона по го Ки Дже со счетом 3:0. AlphaGo — это программа с ненастоящим интеллектом, разработанная DeepMind, частью родительской братии Google Alphabet. В былом году она обставила иного чемпиона, Ли Седоля, со счетом 4:1, однако с тех пор существенно набрала по очкам.

Ки Дже живописал AlphaGo будто «бога игры в го».
Теперь AlphaGo заканчивает играть в игры, предоставляя возможность игрокам, будто и прежде, биться между собой. Ненастоящий интеллект завел статус «игрока из дальнего будущего», до уровня какого людам придется вырастать очень длительно.

На старт, внимание, го


Го — это древняя игра на двоих, где один-одинехонек играет белокипенными фигурами, иной черными. Задача — захватить доминацию на доске, поделенной на 19 горизонтальных и 19 вертикальных линий. Компьютерам играть в го сложнее, чем в шахматы, потому что число возможных ходов в всякой позиции намного вяще. Это делает просчет возможных ходов наперед — вполне вероятный для компьютеров в шахматах — очень сложным в го.
Прорывом DeepMind стала разработка всеобщего алгоритма обучения, какой, в принципе, можно направить в более социально ориентированном течении, чем го. DeepMind говорит, что группа исследователей AlphaGo пробует решить сложные проблемы вроде розыска новых лечений для заболеваний, радикального снижения энергопотребления или разработки новых революционных материалов.
«Если система ИИ доказывает, что способна обретать новоиспеченное знание и стратегии в этих сферах, прорывы будут попросту неописуемы. Не могу дождаться, чтобы увидеть, что будет дальше», говорит один-одинехонек из ученых проекта.
В предбудущем это грозит силом захватывающих возможностей, однако проблемы доколе никуда не делись.

Нейробиология и ненастоящий интеллект


AlphaGo сочетает две мощных идеи на тему обучения, какие получили развитие за заключительные несколько десятилетий: абсолютное обучение и обучение с подкреплением. Что примечательно, оба течения вышли из биологической концепции работы и обучения мозга в процессе получения эксперимента.
В мозге человека сенсорная информация обрабатывается в серии пластов. Например, визуальная информация сперва трансформируется в ретине, затем в посредственном мозге, а затем проходит сквозь неодинаковые области коры головного мозга.
В итоге показывает иерархия представений, где сперва идут простые и локализованные детали, а затем более сложные и комплексные особенности.
Эквивалент в ИИ зовется абсолютным обучением: абсолютное, потому что включает бездна пластов обработки в простых нейроноподобных вычислительных единицах.
Однако чтобы выжить в этом мире, звериным необходимо не всего распознавать сенсорную информацию, однако и действовать в соответствии с ней. Поколения ученых и психологов исследовали, будто звериные занимаются предпринимать деяния, чтобы максимизировать извлекаемую выгоду и получаемую награду.
Все это ввергло к математическим теориям обучения с подкреплением, какое теперь можно имплементировать в системы ИИ. Самой величавой из них изображает настолько величаемое TD-обучение, какое улучшает деяния за счет максимизации ожидания предбудущей награды.

Важнейшие ходы


Игры кончились: AlphaGo займется решением реальных мировых проблем
За счет сочетания абсолютного обучения и обучения с подкреплением в серии искусственных нейронных сетей, AlphaGo сперва научился играть на уровне профессионального игрока в го на основе 30 миллионов ходов из игр между людами.
Однако затем он взялся играть против себя, используя исход всякой игры, чтобы неумолимо оттачивать собственные решения о важнейшем ходе в всякой позиции на доске. Система ценностей сети научилась прогнозировать вероятный результат с учетом любой позиции, а система благоразумия сети научилась принимать важнейшее решение в всякой конкретной ситуации.
Алкая AlphaGo не мог опробовать все вероятные позиции на доске, нейронные сети извлекли ключевые идеи о стратегиях, какие важнецки работают в любой позиции. Собственно эти бесчисленные часы самостоятельной игры ввергли к улучшению AlphaGo за завершающий год.
К сожалению, доколе еще нет знаменитого способа выяснить у сети, что это за ключевые идеи. Мы попросту можем изучать игры и гадать, что что-то извлечем из них. Это одна из проблем использования нейронных алгоритмов: они не объясняют свои решения.
Мы по-прежнему капля соображаем о том, будто обучаются биологические мозги, а нейробиология продолжает предоставлять новоиспеченные ключи наития для ИИ. Люд могут стать экспертами в игре го, руководствуясь гораздо меньшим экспериментом, чем надобен AlphaGo для достижения такового уровня, поэтому пространство для улучшения алгоритмов еще есть.
Кроме того, большущая часть мощности AlphaGo основана на технике метода возвратного распространения оплошки, какая помогает ей исправлять оплошки. Однако связь между ней и обучением в реальном мозге доколе неотчетлива.

Что отдаленнее?


Игра го стала покойной платформой разработки для оптимизации этих алгоритмов обучения. Однако многие проблемы реального мира куда сбивчивее и имеют крохотнее возможностей для самообучения(например, самоуправляемые автомобили).
Существуют ли проблемы, к каким мы можем применить водящиеся алгоритмы?
Одним из образцов может быть оптимизация контролируемых промышленных обстоятельств. Здесь задача дробно состоит в том, чтобы выполнить сложную серию заданий, удовлетворить бездна критериев и минимизировать затраты.
До тех пор, доколе обстановка можно будет аккуратно смоделировать, эти алгоритмы будут заниматься и набираться эксперимента бойче и эффективнее, чем люд. Можно лишь повторить слова братии DeepMind: очень охота посмотреть, что же будет отдаленнее.
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.

комментариев

Ваше имя: *
Ваш e-mail: *
  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent
Код: Кликните на изображение чтобы обновить код, если он неразборчив
Введите код:

Свежие новости

04:31
Режиссер Оливер Стоун опровергает обвинения в домогательствах
04:31
Названа причина задержания сенатора Керимова
04:30
Телеведущий Чарли Роуз уволен после обвинений в домогательствах
04:30
Медики рассказали, как чувствуют себя пострадавшие в ДТП в Марий Эл
04:30
"Скала хищных птиц" открылась в Московском зоопарке после года реконструкции
04:30
1 декабря состоится заседание совета по отречению императора Японии
03:30
Есть мнение, что Tesla закроется в следующем году. Деньги кончатся просто
02:30
Что сейчас предлагают производители Android-планшетов?
02:02
Роналду обновил свой рекорд, забив за календарный год в ЛЧ 17 мячей
02:02
Жена Зобнина: Вторая игра после травмы, а люди пишут гадости. Лицемеры
02:01
Защитник Марибора Билонг: Группа атаки Спартака – восхитительна
02:01
Халл Слуцкого не одержал ни одной победы за месяц
02:01
Сити вырвал победу у Фейеноорда и застолбил за собой первое место в Группе f
02:01
Тоттенхэм одержал волевую победу в Дортмунде
02:00
Ман Сити в группе Лиги чемпионов занял первое место
02:00
Боруссия Д не смогла выйти в плейофф Лиги чемпионов
02:00
Юрген Клопп: На 15 минут прекратили играть в футбол – это наша главная ошибка
02:00
Клопп - Перестали играть в футбол на 15 минут
01:30
Subaru привезет в Лос-Анджелес новый 7-местный кроссовер Ascent
01:00
Электорат не простит: чем грозит запрет на алкоголь до выборов
00:01
России запретили выставлять военную технику на «Фарнборо»
23:30
Али Феруза обвинили в незаконной работе в РФ
23:01
Минкомсвязь: правового обоснования Биткоин не получит
23:00
Автомобили марки Lincoln оснастят HUD-дисплеями вместо лобового стекла
23:00
Toyota показала человекоподобного робота для покорения космоса
23:00
Дрон AquaMAV умеет погружаться в воду, выныривать и продолжать полёт
22:31
Почему нельзя тянуть с покупкой OnePlus 5
22:31
Samsung выпустила апдейт для Gear S3, продлевающий их работу до 40 дней
22:30
Google втайне следит за местоположением пользователей всех Android-устройств
22:30
Как получить OUKITEL MIX 2 раньше остальных
22:30
OnePlus 5T пережил испытания прочности
22:02
Центральный военный оркестр отметил 90‑летие
22:02
Али Феруза неожиданно вызвали в Басманный суд
22:01
Семья россиян подарила юноше танец стриптизерши и сняла Home Video
22:01
Скандал на процессе над Шакро: от адвоката отрекся сообщник
22:00
Школьник из ЯНАО рассказал о сокращении его речи в ролике
22:00
Доклад российского школьника в Бундестаге редактировала немецкая сторона
22:00
Google не будет ранжировать новости RT и Sputnik
21:30
В Челябинске проверяют содержание вредных веществ в выхлопных газах автомобилей
21:30
Появились первые изображения новой Toyota Camry для рынка РФ
Больше новостей