AlphaGo靠自我学习打败了自己
- +1 你赞过了
要说知名度最高的AI智能运算就是阿尔法GO了,在阿尔法GO击败为其最高段位的柯洁之后,基本就超脱人类的范畴了。
不过,我们怎么也没有想到,这个AI智能居然能够完成自我进化。在战胜柯洁后的几个月,进化的AlphaGo Zero已经完胜此前两个版本,更令人惊讶的是,这个AlphaGo Zero的进化方式并非在原来基础上,而是从零开始。过去的AlphaGo都是在与无数人类业余、职业棋手的对决中慢慢成熟,但AlphaGo Zero自诞生起就彻底抛弃了人类学习,转而靠着自我进化、自我对弈孤身成长的方式,一举成为了史上最强的电子棋手。
至于AlphaGo Zero到底有多强?对比第一版打败李世石的第一版AlphaGo,只用了三天时间的训练时间,就取得了100:0的成绩完胜。在这之后AlphaGo Zero又进行了40天的自我对弈学习,继续挑战打败柯洁的第二版AlphaGo,结果是89:11,AlphaGo Zero胜。
某网友心态:一个明明可以用自我进化来提升能力的棋手,之前还被拿来和人类对弈,真是谈浪费了。
研发“这些”AlphaGo的公司DeepMind,在发布于《自然》杂志的论文上提到了许多AI技术上的细节。但按照CEO Demis Hassabis交代我们说法,AlphaGo Zero关键的一点在于去掉了人类认知的不足,消除了对大量数据训练的依赖,这方面一直是AI领域的难题。
目前,有关AlphaGo能否应用在更多策略类游戏还有待考察,但在未来DeepMind相信AlphaGo会有更广阔的前途。
最新资讯
热门视频
新品评测