重生男神从做游戏开始_梦三万_597.老板你做个人吧（第9章）- 笔趣阁

　　 597.老板你做个人吧（第9章） (第2/2页)

曹阳又说到，“我们现在公司的员工已经很多了，各种部门都在扩张，我的打算是，把公司的客服部门和行政部门的一部分人搬走，搬到4环的商业区写字楼里面，虽然租金贵是贵了一点，不过也都不是个事情。

    然后把开拓者工作室群和西幻工作室群也迁走，搬到博米的通天大厦那边，这样就有接纳你们的位置了。”

    “哈！？”

    刘光然整个人如遭雷劈一般。

    什么？！

    我们好不容易搬回去，就是为了看看漂亮的客服小jiejie的，老板你这也太过分了吧？！

    老板你做个人吧！

    ……

    现在刘光然带着曹阳来到博米在中关村租的一个写字楼的1楼小观察室里面。

    这也算是博米的老传统了，为了更好的进行测试和观察，一般情况下会有一个专门用来做测试的小黑屋，在小黑屋的隔壁是观察房。

    两者之间隔着一面单面镜。

    也就是说从观察房能够看到小黑屋当中的情况，但是小黑屋当中看不到，小黑屋当中看过来只能看到一面镜子。

    现在在小黑屋里面，排放着一排电脑，然后几个专业围棋棋手正在进行测试——

    测试的内容就是跟博米开发的【博米围棋大师】进行对战。

    ……

    曹阳不是混围棋圈的人，所以他看过去，也不认识里面的人。

    刘光然说，这些都是受邀来参加的职业5段棋手，棋手在围棋领域当中职业5段就已经相当厉害了。

    “我们这一次稍微调整了一下策略算法。”

    刘光然解释说：博米围棋大师现在主要工作原理是“深度学习”。

    “深度学习”是指多层的人工神经网络和训练它的方法。

    一层神经网络会把大量矩阵数字作为输入，通过非线性激活方法取权重，再产生另一个数据集合作为输出。

    这就像生物神经大脑的工作机理一样，通过合适的矩阵数量，多层组织链接一起，形成神经网络“大脑”进行精准复杂的处理，就像人们识别物体标注图片一样。

    博米围棋大师用到了很多新技术，如神经网络、深度学习、蒙特卡洛树搜索法等，使其实力有了实质性飞跃。

    这些其实都已经是现在世界上研究的软件领域当中最难的课题了。

    好在博米公司起步的早，而且还有着大量的人才和积累，加上曹阳的优秀的眼光和指导，现在的进展非常的顺利。

    ……

    刘光然解释说：“博米围棋大师系统主要由几个部分组成：

    一、策略网络，给定当前局面，预测并采样下一步的走棋；

    二、快速走子，目标和策略网络一样，但在适当牺牲走棋质量的条件下，速度要比策略网络快1000倍；

    三、价值网络，给定当前局面，估计是白胜概率大还是黑胜概率大；

    四、蒙特卡洛树搜索，把以上这四个部分连起来，形成一个完整的系统。”

    ……

    现在，刘光然对博米围棋大师的AI版本进行了多次的更迭，到现在已经比较成熟了。

    博米围棋大师此前的版本，结合了数百万人类围棋专家的棋谱，以及强化学习进行了自我训练。

    博米围棋AI的能力则在这个基础上有了质的提升。

    最大的区别是，它不再需要人类数据。也就是说，它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋，然后进行自我博弈。

    刘光然给曹阳介绍，博米围棋AI使用新的强化学习方法，让自己变成了老师。

    系统一开始甚至并不知道什么是围棋，只是从单一神经网络开始，通过神经网络强大的搜索算法，进行了自我对弈。

    随着自我博弈的增加，神经网络逐渐调整，提升预测下一步的能力，最终赢得比赛。更为厉害的是，随着训练的深入，博米围棋大师团队发现，博米围棋AI还独立发现了游戏规则，并走出了新策略，为围棋这项古老游戏带来了新的见解。

    从某种程度来说，也要归功于之前AI换脸技术带来的灵感。

    AI换脸也是两个【大脑】，一个负责做假，另外一个负责识别，然后看是做假的更厉害，还是能够识别的更厉害，最后一直推演到识别技术也无法区分真假为止，就算是成功了。

    博米围棋大师也是这样，自己的两个大脑互相下围棋，然后把棋谱存下来，作为数据库当中的一部分，之后再不断地从数据库当中进行深度学习，然后又自己跟自己下，不断地重复这个过程，直到最终能快速地产生出最优解。

    之前博米围棋AI仅用了单一的神经网络。