手机浏览器扫描二维码访问
ai的蒙特卡罗算法,用童话故事讲解。
我们用一个童话故事的方式来解释ai中的蒙特卡罗算法(nte
carlo
algorithm),特别是它在博弈论、游戏ai、决策模拟等场景中的应用。
?
童话故事:小狐狸奇奇的果子冒险
很久很久以前,在一个叫做“决策森林”的神奇世界里,住着一只聪明又调皮的小狐狸,名字叫奇奇。
每天清晨,森林里都会出现很多果子树,不同的路径会通向不同的果子。奇奇最喜欢吃红果子,但问题是:有些红果子很甜,有些很苦,而且你不走近去尝一尝,是无法知道的!
而且,森林的路径像迷宫一样复杂,一次只能走一步,一共只能走
10
步。奇奇每天都要做一个决定:要走哪条路,去哪里找果子吃,怎样才能吃到最多好吃的果子?
这对奇奇来说太难了!
?
这时,ai之神悄悄给奇奇一个神奇的法宝:
这法宝名字叫做:
蒙特卡罗模拟法(nte
carlo
simulation)
这个法宝可以让奇奇提前“幻想”几千次自己的走法和吃果子的结果,然后选择最可能成功的那一条。
?
奇奇使用蒙特卡罗模拟的方法如下:
第一步:随便乱走1000次!
奇奇在脑海里幻想自己从现在出发,一直走10步,每次都随机选一个方向。每一条幻想路线都叫做一次模拟。
就像在现实生活中掷骰子做决策那样,蒙特卡罗方法通过“随机”走法来覆盖各种可能。
每次模拟结束后,奇奇会记录下:
?
自己最后吃到了哪些果子?
?
是甜的还是苦的?
?
总共吃了多少好吃的?
第二步:把所有模拟的结果记录下来!
奇奇发现,有一些起始方向,比如往左边走,虽然开始没果子,但最终常常会碰到一大堆红果子树。
而往右走,虽然开始就有果子,但走到第6步就没什么了。
第三步:统计谁最好!
奇奇统计所有模拟中,“哪个第一步方向”最终吃到了最多的甜果子,于是决定——
“我这次就往那个方向走吧!”
这就是蒙特卡罗算法的核心逻辑:
?
用随机采样的方式探索未来的可能性;
海贼:从女帝开始,路飞持续崩溃 三国:身为反贼,没有金手指 被废静心多年,你们才开始后悔? 穿越之异世女领主 兽世溺宠:蛇蛇我啊,万龙之母 庶女当家日常 开局就长生,可我咋是奴隶啊 等你一直等到老 轮回塔 穿书七十年代,过好自己的日子 异能太强,大佬被特殊部门收编了 直播算命:你爹让你扔下水道了 开局逃荒直接掀桌 大反派女魔头,前世居然是男的 北域时空 高中三年,无人知道我已觉醒 开局创建杀手组织,我威压诸天 系统沙雕我添堵,一身反骨离大谱 斩神:我道系青年,请个神合理吧 遗笑苍天
...
...
男人一辈子最值得骄傲的事里包括服一次役,当一回特种兵,和世界上最强的军人交手。还有,为自己的祖国奉献一次青春,为这片热土上的人民拼一次命。这些,庄严都做到了。(此书致敬每一位曾为国家奉献过青春,流过血洒过汗的共和国军人!读者群号764555748)...
一个浑浑噩噩的少年,在阳台吹风不小心掉了下去,死过一次的他,决定开始改变,故事从这里开始,他就是林浩...
玄幻爽文九天大陆,天穹之上有九条星河,亿万星辰,皆为武命星辰,武道之人,可沟通星辰,觉醒星魂,成武命修士。传说,九天大陆最为厉害的武修,每突破一个境界,便能开辟一扇星门,从而沟通一颗星辰,直至,让九重天上,都有自己的武命星辰,化身通天彻地的太古神王。亿万生灵诸天万界,秦问天笑看苍天,他要做天空,最亮的那颗星辰...
江湖日报讯肯麦郎连锁客栈享誉大明各府,其总部却是京城一家名为来福的小客栈。来福客栈在江湖上大名鼎鼎,即便费用高昂,上到各派掌门下到江湖游侠,都挤破脑袋想去来福客栈吃顿饭。记者有幸请到武林盟主,揭开来福客栈的秘密!来福客栈日常一幕少林方丈,你怎么吃饭不给钱啊?偶弥陀佛,出家人身无分文,这顿饭可否算作化缘?不行!武当掌门没钱吃饭,还在后院洗碗呢!你若不给钱,就去洗茅房!来福客栈日常二幕丐帮长老,瞧你样子就没钱吃饭,你来客栈干啥?听闻来福客栈可以拿东西抵押,我这里有本上乘的秘...