第623章

类别:其他 作者:无聊的魔方字数:4249更新时间:22/07/20 11:19:59
突然落寒不知道想到了什么,他拿出手机开始查看其他各省成绩。

果不其然李子舟这个小正太,竟然进决赛了,而且他还是人大附中的组长,拿了83分。

落寒证实了自己的猜想,这个李子舟简直就是一个心机表。

这下落寒对他印象更差劲了,一个男孩子天天哭哭啼啼的,一点男子汉气概都没有。

而且落寒最讨厌这种考的还行,然后一副我考砸了求安慰的样子的人了,落寒认定了李子舟就是靠着年龄小在博同情。

他哪里知道李子舟这个天才少年上高中以前一直顺风顺水的,样样都是第一。

他又是班里最小的,大家都比较让着李子舟,直到去年进国决失败,这是他第一次遭受到挫折。

李子舟憋了一口气,默默的努力一年,就等着今年来雪耻的。

天有不测风云,谁知道题目如此之难,李子舟并没有把握晋级,他在食堂想到自己努力一年可能会被淘汰了,情绪一下控制不住就哭了起来。

反正只是个路人,落寒没想两下就把李子舟从脑海里扔出去,反正以后不让叶云嫣和他再接触就好。

国预没有个人奖项,国决除了设置特等奖,一二三等奖外,还会设置个人的金银铜牌。

不过只要进了国决就会有将拿这是一定的,高考至少有5分加分,至于会不会被博雅水木等985大学看上提前签约,就看各自水平及运气了。

落寒团体特等奖和个人赛金牌是志在必得,要是能提前签约就更好了。

目前在学校上高中课程对落寒来说就是在浪费时间,落寒在课堂上也不能太过分了,对老师保持必要的尊重那是一定的。

签约后落寒就能专心按自己的规划做事了,不过落寒觉得可能性不大。

博雅和落寒签计算机专业的约有百分之八十的可能性,但问题是他要进入数学专业,博雅估计不会认可落寒的数学水平。

他也没参加过什么数学竞赛,主要就是重生是有点晚,数学竞赛的名早都报上去了。

下午还有几个小时的休息时间,大家把心里的激动兴奋发泄完了就都散去了。

落寒和于老师打了一个招呼,独自一个人徜徉在博雅的校园内,走走停停的看风景,昨天只是粗略的逛了逛,说实话博雅的校园真的是很美。

博雅来都来了,索性好好了解一下自己未来四年将要生活的地方,落寒还特意去看了看医学部和数院之间的所有路段,就当提前考察一下。

以后少不了在这两地之间奔波,还有颜伟的计算计学院,就是不知道颜伟能不能考上,以他现在的水平算上加10估计还是有点危险。

落寒记得自己这界西北省一本分数线是近十年来最高的,颜伟和上辈子完全已经是完全不同了,能做的落寒都已经做了。

剩下就看他的现场发挥了,不过有很大可能就算是考上了还会被调剂到别的专业,就是不知道博雅转专业困不困难。

落寒也没怎么逛,大概熟悉了一下环境就回去了,晚上还有顿大餐,于老师请客,落寒可还是记得的。

......

晚上,于老师说话算话,请全体队员吃了顿大餐,算是壮行。

明后两天,落寒和他的小组将继续战斗,博雅的校园里从不缺少奇迹,亦不缺少人杰,这次,落寒能否创造奇迹?

一夜无话。

三月十八日上午,还是昨天考试的那栋教学楼,博雅二教,国决上半场即将开赛。

赛前所有参赛小组都已经将作品提交,评委们已经有了大致的了解。

国决是分上下半场的,今天8:30—12:30,这是三小时是上半场。

下午14:00—17:00,是下半场。

十二个晋级小组平均分到两个半场,一个半场六组,落寒他们被分在下半场。

下午两点,落寒第一个上台,打开提前准备好的ppt,别上麦克风。

“各位评委老师老师好,我是来自西北省梨城四中的落寒,我这次的参赛作品是一款可以下围棋的机器人系统,目前系统的围棋水平已提升至专业四段。”

虽然早已看过落寒提供的系统,但是当他真正说出这款系统下棋水平的时候,台下的评委都倒吸一口冷气,有的还表示怀疑,并不相信。

之前他们都觉这款系统能有围棋业余水平就已经很不错了,没想到竟然达到了专业五段。

这可不是什么五子棋,跳棋之类的简单棋类,而是繁杂无比的围棋,光是棋谱就有几十万种,再加上其排列组合,变换无比复杂。

博雅也有相关的课题组,不过制作出来的成品都没有这么高的水平。

底下一个带着眼镜,四十多岁头有秃的评委,立刻激动的站起来,出声打断道:“这个系统是独立制作的么?你是采用什么了设计原理?

在没有外界的资源的帮助下,你如何搜集到大量棋谱,提升其围棋水平的。”

在看到落寒的系统比自己目前研究的高端许多后,这位评委根本没办法控制住自己按照流程等待落寒讲解完场后在发问。

因此他直接不顾现场答辩规则,直接打断落寒的讲述,迫切的希望得到答案。

出声破坏流程的是张卫国,其他评委都面面相觑。

这个老张本来就是个技术痴,他还是研究智能系统这块的,如今一个不到二十岁的小伙子,在自己浸淫二十多年擅长的方面超越了自己,由不得他不激动。

就跟有个五六岁的小孩,到你面前轻而易举的解决了你数十年都没有解决的难题。

其他评委换位思考,要是换做是自己,估计也会和他一样,甚至更加激动。

哪管的了什么大会流程,所以其他评委都默契的没有阻止他的发问。

张卫国以为落寒和他们采取了一样的设计原理,博雅他们设计的系统包含了“策略网络”“快速落子”和“价值网络”。整个机器人包含了两个大脑,“落子选择器”和“棋局评估器”。

一个四人小组,尤其是其他四人还在打酱油的情况下,落寒想要通过记录棋谱来提升系统的水平显然是不可能。

“呃......”落寒有点懵,这才刚讲一句话就被评委提问了,还这么激动,有点想要冲上台来的样子,这什么情况?

还是会长看出来落寒的的疑问,开口到:“卫国,你先坐下,你看你都吓住这位同学了。

我要是没记错,这位同学是叫落寒吧,我们就跳过之前的阶段,直接开始答辩吧!

我们都比较想知道你的设计原理。”

台下的正在等待上台的其他小组都难以置信。

台下的评委都是什么人,至少都是博雅的副教授,现在他们都不知道落寒围棋机器人系统的设计原理。

他们不知道落寒这个系统所代表的含义,不代表这些在行业内研究几十年的评委们不知道。

如果这个系统真的如落寒所说,那它就象征着计算机技术已进入人工智能的新信息技术时代(新it时代),其特征就是大数据、大计算、大决策,三位一体。

它的智慧正在接近人类。

“对不起,小同学,你继续讲,我有点激动了。”张卫国此时也反应过来了,讪讪一笑对落寒道了个歉坐下来了。

落寒一看,既然评委们都这么说了,他索性就放弃了之前准备的演讲稿,直接回答起问题来。

“我设计的这款系统是基于神经网络原理,与目前世面上机器人系统最大的区别就是,它不再需要人类数据。

也就是说,它一开始就没有接触过人类棋谱。它使用新的强化学习方法,让自己变成了老师。”

看着台下的评委都露出一股思索的表情,落寒继续补充道:

“这个系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。

随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。”

落寒慢慢讲诉着自己的设计理念,评委则是越听越吃惊,心里都泛起惊涛骇浪,就算是不是研究智能系统这一方向的老师,都开始感兴趣起来。

“理论上来说,它不光可以成为围棋机器人,他甚至可以通过自我博弈学习任何一种棋类。”

落寒发现刚才那位评委又开始兴奋起来,他赶忙说道:

“不过,我也不知道什么地方出来问题,导致这个系统在提升到职业五段的水平后,就停止不前了,目前我还没找到解决办法。”

张卫国一听又重新平静下来,继续问着关键问题:

“那你落子时如何选择的?选择方案是什么?”

“根据我了解的相关论文文献,到现在为止所有研究所设计的相关系统,落子时的选择都是基于两方面的考虑。”

“一是通过训练形成一个‘策略网络’,主要是将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

然后,训练出一个‘价值网络’对自我对弈进行预测,以-1(对手的绝对胜利)到1的标准,预测所有可行落子位置的结果。

这两个网络自身都十分强大,而目前国际上所有的相关文献描述的都是,将这两种网络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。”

张卫国推了推眼镜,额头微点,这个落寒肚子里倒是有不少货啊,他说的正是他们的设计思路。

“而我的系统在设计如何落子时是将上述两个神经是网络合二为一,摒弃了棋谱,通过它自己产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

让它从低级的对战慢慢成长,从而让它能得到更高效的训练和评估”

落寒停顿了一下,观察了一下评委,发现他们差不多消化了他所说的信息,继续道:

“在获取棋局信息后,围棋系统会神经网络中根据策略网络功能,探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为阿尔法围棋的最终选择。

在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,围棋系统的搜索算法就能在其计算能力之上加入近似人类的直觉判断。”

前世包括阿尔法系统的旧版本,都是结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。

而现在落寒所讲述的方法,还没有任何期刊杂志发表过,毫不过分的说落寒现在的方法是全球首创也不为过。

当然这是在获得深度睡眠学习系统后,在梦里附身前世阿尔法的机器人的主创人员学到的办法,只是时间有些短,现在还有一些问题没有解决。

......

台上,落寒对着一堆博雅的教授副教授继续侃侃而谈,回答者他们各种各样的问题。

落寒根本不像是在进行答辩,反而像是在给他们开报告会,只是地点有些不对罢了。

问题回答的差不多了两方又开始分析系统没达到预期效果的原因,集思广益,所有的评委都参与进来,众人开始讨论。

“我觉的进化到专业五段就停止,问题还是在你构建的单一神经网络上,会不会是你的网络太简略,已经到达了极限无法支撑其继续自我博弈。”

“我不这么觉得,既然可以自我学习,就代表神经网络应该没问题。

可能是你的电脑硬件的方面的问题,储存空间有限,毕竟你是自己在单打独奏,设备跟不上是有很大可能的。”

一个皮肤黝黑,理着光头三十岁左右的老师开口道,这还是他今天第一次开口询问。

落寒从上午看到这位老师,就有点疑惑他真的是研究计算机的么?

隔着衣服都能感觉到他身上的肌肉块棱角分明,出去说他是健身教练一点都不为过。