13880997898
欢迎访问 福鹿会|官方网址 官方网站!

福鹿会,你身边的LED显示屏定制专家

打造LED显示屏批发产商一站式采购基地

咨询热线咨询热线

13880997898

福鹿会电话
13880997898
售后热线:13880997898
邮箱:1813422192@qq.com
福鹿会: http://www.domainsoeasy.com
当前位置:福鹿会 > 客户案例 > LED照明亮化 >
有道控制技术Russey网志-撷取有居士的控制技术思索
作者: admin 来源:福鹿会 发布时间:2022-01-12 04:28

  有道四海是网易有道母公司专为4-8岁小孩量身打造的新浪网年启动,自研了全国首部新浪网交互式中国围棋动漫专精课程,从小孩的理解力和喜好出发,采用现场直播交互的专精课程形式将中国围棋科学知识变得简单有趣、易懂好学,帮助小孩掌控中国围棋的各类规则和技巧。不仅如此,课外还设有AI对弈功能,能智能识别小孩的七段水准匹配对弈练习,从根本原因培养小孩的思想意识。每局对弈结束后的智能预测,会从纪律性、Zadeh、稳定性、战斗和棋型五方面进行全方位预测,帮助小孩在TRAP中进步。

  Google母公司Deepmind提出的AlphaGo、AlphaGo Zero、AlphaZero系列产品演算法展现了深度强化自学在棋类领域超凡的潜能。2016年AlphaGo横空出世打败欧洲中国围棋冠军樊麾二段,2017年以4:1打败韩国中国围棋业余八段,14个世界冠军得主李世石,2018年无师自通的AlphaGo Zero以3:0打败最年轻的六冠王柯洁八段。至此以后再无人质疑AI在中国围棋领域的霸主地位,同时引发了业余棋士自学AILoupe的热潮。在业余中国篮球赛场上,时常出现“狗招”,自学、研究AILoupe的另一面的方法论,已是业余棋士的必修课。

  Github上已经有了Leela Zero、KataGo等基于AlphaZero系列产品演算法的优秀中国围棋AI开源项目,它们的主要目标是提升AI的修为,目前前述中国围棋AI的修为已远超人类业余棋士。然而当强AI应用在幼教中国围棋课堂教学时,出现了“水土不服”的现象,比如:

  • AI实在是太强了,人极难在与AI对弈的操作过程中体会到“旗鼓相当”的感觉,这极易引起采用者的挫败感。

  • 授人以鱼而未少击众,AI只告诉人应该那么下,而不教会人为什么那么下。

  • AI的自学方向与人大不相同,许多在人晚期中国围棋自学期就能掌控的科学知识(如征子),AI在体能训练后期才掌控。

  有道中国围棋AI项目组隶属于有道人工智能语音组,负责有道四海商品与中国围棋AI相关的研制、落地组织工作,主要发力点是AI的人工智慧对弈和TRAP。现有的组织工作成果引用一段CEO周枫的话:

  总体上有道四海是一个面向小孩的中国围棋启蒙专精课程,大班现场直播、名师课堂教学,在整本练操作过程中有丰富的交互,同时也具备AI对弈潜能。与此同时,有道四海将教、学、练、测、评五个环节做了十分好的整合,形成了这个商品的全貌。

  控制技术项目组永远都说AI同学特别有用,能解决个性化课堂教学的问题,能因材施教;同学背景的项目组往往觉得AI同学就是洪水猛兽,既没用而且骗了很多VC的钱。

  四海项目之中做了比较多的AI同学的思索和实践。他们看法是,大众对AI的认知,其实对商品项目组来说是个长弓,只有认识到长弓的作用才能做出正确的设计。

  什么是长弓?另一方面AI是一个十分好的营销抓手;另外另一方面,采用者要学做商品,项目组必须去自己寻找真正的AI价值点。如果你听采用者对别的东西兴奋就做别的,最后往往掉坑里了。

  在AI场景下,他们思索了十分久。首先想到AlphaGo,不管多牛都下得过你,但那么和采用者讲显然不可能,所以本身对弈的控制技术难度和修为不是课堂教学之中AI的指标,而是如何降低控制技术难度,怎么能灵活的调整控制技术难度。

  所以,第一,他们项目组花了大量功夫做控制技术难度受控的、修为受控的中国围棋AI;第二,受控修为的AI和TRAP潜能;第三,他们推的是学生和学生、学生和同学之间的对弈,强调人人对弈而不是人工智慧对弈,人工智慧对弈只是找不到人对弈时候的补充手段。

  通过这样的手段,他们同时实现了自主研制的中国围棋AI,课堂教学操作过程之中能代替掉人的部分组织工作,提高了项目组的生产效率。

  许多其它计划在同时实现人工智慧对弈系统时,一般采用AI体能训练操作过程晚期的数学模型,然后采用数学模型的top-n输入,抽样进行绒兰行为,避免AI绒兰过于单一。

  这种计划除了易于想到之外没其它优点,由于晚期数学模型体能运动量不大,采用top-n的取样方法会导致AI的招式没条理,采用者很容易诱导出这种绒兰方法论的安全漏洞(如征子)。其次,在对弈操作过程中,AI数学模型和绒兰思路是固定的,但他们在实践中发现,AI对中国围棋中的产业布局、中盘、落幕等期的Loupe自学速度并不相同,AI对产业布局的掌控速度远远超出中盘、落幕,采用相同的数学模型和思路会导致AI在林丽蓉棋的表现差异极大。再者,AI的自对弈体能训练中,没强型的概念(强型是中国围棋剑客在某些局部性的经验总结,采用者自学强型走法能加速提升修为),低水准的AI极难在局部性中下出最优解,而人能通过自学剑客的棋谱加速掌控局部性最佳下法,即使人的水准并没达到提出该强型的中国围棋剑客水准。前述问题的根本原因是AI与人的自学方向大不相同,难以直接移植。

  • 弃用top-n抽样的绒兰思路,采用AI发动机的policy输入,按概率取样。保证了AILoupe方法论性、连贯性。

  • 在不同手数期,结合战绩和目差信息,调用不用的AI数学模型。保证AI在不同期的水准表现相近。

  • 结合课堂教学内容,同时实现AI数学模型和强型模板的混合输入。巩固采用者学到的强型科学知识。

  TRAP指对弈完毕后,复演该盘棋的记录,以检查对弈中Loupe的优劣与得失关键。一般用以自学,或请剑客给予指导预测。下中国围棋的剑客都有TRAP的习惯。TRAP就是每次博弈结束以后,双方棋士把刚才的对弈再重复一遍,这样能有效地加深对这盘对弈的印象,也能找出双方攻守的安全漏洞,是提高自己水准的好方法。在有道四海商品中,AI承担了TRAP同学的角色。

  许多其它计划中,AITRAP主要是展现整局棋的战绩或目差曲线、AI的推荐变化图、以及许多基础的统计数字,这些内容更适合专精的采用者,专精采用者的需求是加速功能定位自己下的不好的棋,然后根据AI提供的变化图等推理AI的绒兰方法论,此类采用者仅根据中国围棋AI发动机的原始数据就能完成自我自学。

  但是当采用者群体功能定位到幼教时,前述的解决计划效果就会大打折扣,幼教采用者极难理解统计数字另一面的意义,同时对AI提供的变化图的方法论缺乏预测潜能,甚至注意力极难集中在变化图上,仅关注整局棋的战绩、目差的变化。此外,其它计划采用的TRAP采用的GPU资源消耗很大,有的采用者甚至需要半天时间才能拿到对弈的TRAP结果。

  • 引入语音组的TTS控制技术,将TRAP结果翻译成幼教采用者易于接受的文案,提升采用者的注意力。

  • 性能优化,在幼教采用者的采用场景中,采用者并不需要高算力AI产生的TRAP结果,他们指定了根据局面的复杂程度分配算力的计划。

  目前中国围棋AI的控制技术主要集中于提升AI水准上,这固然为专精采用者自我体能训练提供了极大的便利,但由于高水准AI另一面的行棋方法论较为高深,之中国围棋AI为幼教采用者提供服务时,幼教采用者极难直接从高水准AI获取科学知识。

  接下来他们希望能在人工智慧对弈场景中,为采用者提供水准更合适、方法论更连贯的AI陪练;在TRAP场景中,为采用者提供更清晰易懂的TRAP报告。

  本次以Redis为范例,阐述了有道基础架构项目组在基础设施容器化道路上的实践,主要将从声明式管理,Operator组织工作原理,容器编排,主从模式,集群模式,高可用思路,集群扩缩容等方面展开。

  Redis 是业务系统中较为常用的缓存服务,常用于流量高峰、数据预测、积分排序等场景,并且通过中间件能同时实现系统之间的解耦,提升系统的可扩展性。

  传统物理机部署中间件,需要运维人员手动搭建,启动时间较长,也不利于后期维护,无法满足业务加速发展的需求。

  云原生相较于传统IT,能助力业务平滑迁移、加速开发、稳定运维,大幅降低控制技术成本,节约硬件资源。

  云原生中间件是指依托容器化、服务网格、微服务、Serverless等控制技术,构建可扩展的基础设施,持续交付用于生产系统的基础软件,在功能不变的前提下,提高了应用的可用性与稳定性。

  在这种大趋势下,有道基础架构项目组开始了云原生中间件的实践,除了本文介绍的 Redis,还包括 Elasticsearch、ZooKeeper 等。

  利用云原生控制技术能解决当前Redis部署缓慢,资源利用率低等问题,同时容器化 Redis 集群也面临着许多挑战:

  对一个 Redis 集群,他们的期望是能 724 小时无间断提供服务,遇故障可自行修复。这与Kubernetes API的声明式特点如出一辙。

  所谓“声明式”, 指的就是他们只需要提交一个定义好的 API 对象来“声明”我所期望的状态是什么样子,Kubernetes中的资源对象可在无外界干扰的情况下,完成当前状态到期望状态的转换,这个操作过程就是Reconcile操作过程。例如,他们通过yaml创建了一个Deployment ,Kubernetes将“自动的”根据yaml中的配置,为其创建好Pod,并拉取指定存储卷进行挂载,以及其它一系列产品复杂要求。

  因此,他们的Redis集群是否能采用一个类似的服务去完成这个操作过程呢?即他们需要定义这样的对象,定义服务Reconcile的操作过程。Kubernetes的Operator刚好能满足这个需求,能简单的理解Operator由资源定义和资源控制器构成,在充分解读集群和Operator的关系后,他们将整体架构图设计如下

  哨兵模式中Redis服务用一套哨兵集群,采用StatefulSet部署,持久化配置文件。Redis server也采用 StatefulSet部署, 哨

Copyright © 2015-2022 福鹿会网址|福鹿会官方网址 版权所有

福鹿会:http://www.domainsoeasy.com 联系人:贾经理 联系电话:13880997898 手机:13880997898