凯发娱乐城

注册游戏账号

新葡京娱乐城

进入游戏大厅

博天堂娱乐城

真人棋牌游戏开户

您现在的位置:博彩乐园>博彩游戏问答> 正文

DavidSilver增强学习补充——21点游戏BlackjackExampl

来源:http://www.2234yule.com 作者:博彩游戏问答

真人棋牌游戏

博天堂

  游戏问答

  (PS:为了尽可能理解如何运用MC方法求解21点游戏,我们将信息更加细化——相比David Silver的PPT。)
21点游戏规则
大多数赌场使用6副牌或8副牌玩这种游戏,以防止“数牌点”,在本次模拟中使用两副牌(共104张,分别为8个1,2,3,4,5,6,7,8,9,10,J,Q,k)。
只有2位参与者,玩家和庄家。
游戏开始时每人得到两张牌,对于牌面为2-10的牌,点数和面数相同;对于为花牌(J、Q、K)的牌,点数为10;牌面为A的牌,点数为1或者11。
游戏的目的是得到总数尽量接近21点的牌,不得超过,并使玩家得到的总点数多于庄家。
如果开始两张牌的总点数恰为21(A-10或A-花牌),称为21点,自动成为胜者(若玩家和庄家都得到21点,则为平局,玩家的赌注仍在台上)。
靠21点赢时,付给玩家3赔2,即1.5赔1(1元赌注赢1.5元,且1元赌注仍保留)。
如果玩家和庄家都未得到21点,玩家想要多少张牌就可以取多少张牌,一次一张,使总数尽量接近21点,如果玩家超过了21点,就输了,游戏结束。
一旦玩家对牌的点数满意,玩家就“打住”,然后庄家按照下列规则取牌:
当庄家牌的点数为17、18、19、20和21时,就打住;
若庄家牌的点数小于或等于16,必然取牌。庄家总把A的点数记为11,除非这样使他超过21(这时A的点数记为1)。
例如,庄家的A-6组合是17点,不是7点(庄家没有选择权),且庄家必须打住在17点上。而若庄家有A-4组合(15点),又拿了一张K,那么新的总点数是15,因为A回到点数1(使之不超过21点),庄家还要再取牌。
如果庄家超过21点,玩家就赢了(赢赌注的钱,每1元赌注赢1元)。
如果庄家的总点数超过玩家,玩家将输掉全部赌注。
如果庄家和玩家的总点数相同,为平局(玩家不输也不赢)。 赌场中这个游戏的刺激之处在于,庄家开始的两张牌一张明、一张暗,所以玩家不知道庄家牌的总点数,必须根据那张明牌赌一把。
在这个项目模拟中玩家不用考虑这种情况,玩家需要做的是:用两幅牌做12次游戏,玩家可以有无限的赌资,每次下赌2元。两副牌玩过一次后,用两幅新牌(104张)继续玩。这时记录玩家的得分(加或者减X元),然后下一幅牌从0开始。输出是12次游戏的12个结果,可以用平均数或总数决定玩家的总成绩。
运用MC方法求解玩家的最佳策略是什么?
求解过程
第1步 初始化。
第2步 得到 DavidSilver增强学习补充——21点游戏BlackjackExampl
(A,2,3,4,5,6,7,8,9,10,J,Q,k)内的随机数 DavidSilver增强学习补充——21点游戏BlackjackExampl
DavidSilver增强学习补充——21点游戏BlackjackExampl
DavidSilver增强学习补充——21点游戏BlackjackExampl
DavidSilver增强学习补充——21点游戏BlackjackExampl
,计算 DavidSilver增强学习补充——21点游戏BlackjackExampl
DavidSilver增强学习补充——21点游戏BlackjackExampl
的和SUM1(玩家总点数 DavidSilver增强学习补充——21点游戏BlackjackExampl
),DavidSilver增强学习补充——21点游戏BlackjackExampl
DavidSilver增强学习补充——21点游戏BlackjackExampl
的和SUM2(庄家总点数 DavidSilver增强学习补充——21点游戏BlackjackExampl
),同时庄家现出自己的第一张牌 DavidSilver增强学习补充——21点游戏BlackjackExampl

第3步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
>10,出现花牌,则将其值改为10,并重新计算SUM1。
第4步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
>10,出现花牌,则将其值改为10,并重新计算SUM1。
第5步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
>10,出现花牌,则将其值改为10,并重新计算SUM2。
第6步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
>10,出现花牌,则将其值改为10,游戏问答并重新计算SUM2。
第7步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值是否为1,若等于1将其值改为11,重新计算SUM1,并判断SUM1是否大于21,若大于21则将 DavidSilver增强学习补充——21点游戏BlackjackExampl
改为1,并重新计算SUM1,若没有大于21则继续第9步;若 DavidSilver增强学习补充——21点游戏BlackjackExampl
不为1,直接进行第9步。
第8步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值是否为1,若等于1将其值改为11,重新计算SUM1,并判断SUM1是否大于21,若大于21则将 DavidSilver增强学习补充——21点游戏BlackjackExampl
改为1,并重新计算SUM1,若没有大于21则继续第10步;若 DavidSilver增强学习补充——21点游戏BlackjackExampl
不为1,直接进行第10步。
第9步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值是否为1,若等于1将其值改为11,重新计算SUM2,并判断SUM2是否大于21,若大于21则将 DavidSilver增强学习补充——21点游戏BlackjackExampl
改为1,并重新计算SUM2,若没有大于21则继续第11步;若 DavidSilver增强学习补充——21点游戏BlackjackExampl
不为1,直接进行第11步。
第10步 判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值是否为1,若等于1将其值改为11,重新计算SUM2,并判断SUM2是否大于21,若大于21则将 DavidSilver增强学习补充——21点游戏BlackjackExampl
改为1,并重新计算SUM2,若没有大于21则继续第12步;若 DavidSilver增强学习补充——21点游戏BlackjackExampl
不为1,直接进行第12步。
第11步 玩家判断SUM1是否大于等于决策数,若是则玩家停止取牌,跳到第13步;若没有则继续取牌,得到 DavidSilver增强学习补充——21点游戏BlackjackExampl
内的随机数 DavidSilver增强学习补充——21点游戏BlackjackExampl
,进行第12步。
第12步 同第4步和第8步,判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
>10,则将其值改为10,并将其值加到SUM1;接着判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值是否为1,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
等于1将其值改为11,重新计算SUM1,并判断SUM1是否大于21,若大于21则将 DavidSilver增强学习补充——21点游戏BlackjackExampl
改为1,并重新计算SUM1,若没有大于21则回到第11步;若 DavidSilver增强学习补充——21点游戏BlackjackExampl
不为1,直接进行第13步。
第13步 庄家判断SUM2是否大于16,若是则庄家不取牌,跳到第15步;否则庄家取牌,得到 DavidSilver增强学习补充——21点游戏BlackjackExampl
内的随机数 DavidSilver增强学习补充——21点游戏BlackjackExampl
,进行第14步。
第14步 同第6步和第10步,判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
>10,则将其值改为10,并将其值加到SUM2;接着判断 DavidSilver增强学习补充——21点游戏BlackjackExampl
的值是否为1,若 DavidSilver增强学习补充——21点游戏BlackjackExampl
等于1将其值改为11,重新计算SUM2,并判断SUM2是否大于21,若大于21则将 DavidSilver增强学习补充——21点游戏BlackjackExampl
改为1,并重新计算SUM2,若没有大于21则回到第13步;若 DavidSilver增强学习补充——21点游戏BlackjackExampl
不为1,直接进行第15步。
第15步 比较SUM1和SUM2的大小。
If(SUM121SUM221)or(SUM1=21SUM2=21),则为平局,得分SCORE=0;
If SUM1=21SUM2≠21,则玩家赢,得分SCORE=3;
If(SUM2=21SUM2≠21)or(21SUM2SUM1),则庄家赢,得分SCORE=-2;
If 21SUM1SUM2 则玩家赢,得分SCORE=2; If 21SUM1=SUM2 则为平局,SCORE =0. 第16步 输出得分SCORE。 在matlab中进行仿真,共有两个文件dian21.m和choose.m。
程序dian21.m
function y=dian21() n=input(请输入局数:) SUM=0%玩家的得分 flag=input(请输入决策数:) %我们可以改变决策数的值,测试哪一个值最优 %决策数具体的含义是:玩家的总点数大于决策数就停止取牌 for i=1:n%总共进行的局数 %%第1步 a=ones(8,13)%产生8*13的矩阵,代表分别有8个A,2,3,4,5,6,7,8,9,10,J,Q,k numz=0%庄家手里牌的数量 numw=0%玩家手里牌的数量 pz=[]%储存庄家手里牌的点数 pw=[]%储存玩家手里牌的点数 totz=0%庄家总点数 totw=0%玩家总点数 %%第2步,第3、4、5、6、7、8、9、10步隐含在了choose.m函数中 [numz,pz,a]=choose(numz,pz,a)%庄家第一次要牌 totz=totz+pz(numz) [numz,pz,a]=choose(numz,pz,a)%庄家第二次要牌 totz=totz+pz(numz) [numw,pw,a]=choose(numw,pw,a)%玩家第一次要牌 totw=totw+pw(numw) [numw,pw,a]=choose(numw,pw,a)%玩家第二次要牌 totw=totw+pw(numw) %%玩家做出决定是否继续要牌 while 1 if (totwflag)%如果玩家当前手里牌的点数相加已经超过了决策数则停止要牌 break else%否则继续要牌,直到超过决策数 [numw,pw,a]=choose(numw,pw,a) totw=totw+pw(numw) end end %%庄家做出决定是否继续要牌 while 1 if (totz=17)(totz=21)%如果庄家当前手里牌的总点数已经等于或超过17则停止要牌 break end if totz17%如果庄家当前手里牌的总点数小于17则继续要牌 [numz,pz,a]=choose(numz,pz,a) totz=totz+pz(numz) else b=0 for i=1:numz if pz(i)==11%如果庄家手里的牌某一张为11 pz(i)=1%将这张牌变成1 totz=totz-10%庄家当前手里牌的总点数-10 b=1%代表修改过庄家的牌 break end end if b==0 break end end end SCORE=0 if (totw21 totz21)

   (totz==21totw==21) %(玩家21庄家21)或者(玩家=21庄家=21) SCORE=0%平局,得分0 else if (totw==21 totz~=21) %(玩家=21庄家不等于21) SCORE=3%玩家胜利,得分3 else if (totz==21totw~=21)

   (21totz totztotw)

  (totw21 totz21) %(庄家=21玩家不等于21)

  (庄家21玩家庄家)

  (玩家21庄家21) SCORE=-2%庄家胜利,得分-2 else if (21totw totwtotz)

  (totz21 totw21) %(玩家21玩家庄家)

  (玩家21庄家21) SCORE=2%玩家胜利,得分2 else if 21totw totw==totz %(玩家21玩家=庄家) SCORE=0 end end end end end SUM=SUM+SCORE end fprintf(玩家得分平均值SCORE=%d\n,SUM/n)程序choose.m
function [num,p,a]=choose(num,p,a) while 1 Sum=0 %产生2个随机数m和n m=fix(rand(1)*8)+1%随机数m:1-8,代表每种牌有8张 n=fix(rand(1)*13)+1%随机数n:1-13,代表1,2,3,4,5,6,7,8,9,10,J,Q,k if a(m,n)==1%代表这张牌没有被要过 a(m,n)=0%代表这张牌没有被要过 num=num+1%牌的数量+1 %%第3、4、5、6步 if n10%若n>10,出现花牌,则将其值改为10 n=10 end p=[p n]%将n添加到点数的末尾 %%第7、8、9、10步 for i=1:num%将每次牌的点数相加 Sum=p(i)+Sum end if n==1%判断n是否为1,若等于1 if Sum21%判断点数是否小于21,若小于21 n=11%将n改为11 end end break end end 求解结果
dian21
请输入局数:10000 请输入决策数:10
玩家得分平均值SCORE=-2.976000e-01 dian21
请输入局数:10000 请输入决策数:11
玩家得分平均值SCORE=-1.553000e-01 dian21
请输入局数:10000 请输入决策数:12
玩家得分平均值SCORE=-5.760000e-02 dian21
请输入局数:10000 请输入决策数:13
玩家得分平均值SCORE=1.010000e-02 dian21
请输入局数:10000 请输入决策数:14
玩家得分平均值SCORE=-1.950000e-02 dian21
请输入局数:10000 请输入决策数:15
玩家得分平均值SCORE=1.080000e-02 dian21
请输入局数:10000 请输入决策数:16
玩家得分平均值SCORE=6.600000e-02 dian21
请输入局数:10000 请输入决策数:17
玩家得分平均值SCORE=8.020000e-02 dian21
请输入局数:10000 请输入决策数:18
玩家得分平均值SCORE=-6.900000e-02 dian21
请输入局数:10000 请输入决策数:19
玩家得分平均值SCORE=-3.064000e-01 dian21
请输入局数:10000 请输入决策数:20
玩家得分平均值SCORE=-8.145000e-01 dian21
请输入局数:10000 请输入决策数:21
玩家得分平均值SCORE=-1.387000e+00 可见,在决策数为17时玩家的平均得分最高。
所以最终决策是:玩家的总点数大于17就停止取牌。

  • 原文标题:DavidSilver增强学习补充——21点游戏BlackjackExampl
  • xpj

    9you娱乐城

    特别推荐

    
  • 谷歌搜索留痕推广
  • 谷歌搜索留痕排名技术
  • 谷歌快速排名
  • 留痕方法
  • 谷歌搜索快速方法
  • google搜索留痕程序
  • 谷歌快速排名
  • 澳门太阳城
  • 最大博彩公司
  • 谷歌搜索关键词排名
  • 搜索留痕程序
  • 谷歌排名出售
  • 谷歌蜘蛛池排名
  • 搜索留痕软件
  • 缅甸果敢赌场
  • 电子游艺规则
  • 谷歌留痕推广
  • google引流程序
  • 谷歌快速排名
  • google引流程序
  • 留痕推广
  • 大西洋城赌场
  • 买球地址
  • 搜索留痕
  • 搜索留痕程序出售
  • 谷歌蜘蛛池排名技术
  • 留痕程序
  • 如何提高google搜索排名
  • 数字币博彩
  • 洗钱方法
  • Google留痕收录
  • 最新谷歌搜索留痕排名
  • 搜索留痕
  • Google留痕收录
  • google搜索留痕
  • 数字币博彩网站
  • 足球投注平台
  • 博彩推广话术
  • 推广引流方法
  • 引流方法
  • 博彩推广话术
  • 网上博彩推广引流
  • 数字币赌场
  • 皇冠现金网
  • 蜘蛛池排名
  • 谷歌蜘蛛池
  • 留痕程序出售
  • google搜索留痕程序
  • 比特币网上赌场
  • 洗钱平台
  • 搜索留痕
  • 博彩推广方式
  • 网上博彩推广
  • 快速排名
  • 搜索留痕程序
  • bbin平台大全
  • 体育博彩公司排名
  • 留痕排名技术
  • 最新谷歌关键词排名
  • 推广渠道
  • 谷歌快速排名
  • 博彩推广
  • 世界杯赌球地址
  • 皇冠博彩公司
  • 谷歌排名出售
  • 博彩引流渠道
  • 搜索留痕程序
  • google搜索留痕
  • 引流渠道
  • 果敢网上赌场
  • 世界杯赌球
  • 搜索留痕方法
  • 博彩搜索留痕
  • 博彩引流
  • 博彩引流
  • 搜索留痕
  • 缅甸网上赌场
  • 欧洲杯赌球
  • 谷歌搜索排名
  • 留痕程序
  • 网上博彩推广引流
  • 留痕技术
  • 搜索留痕技术出售
  • 澳门威尼斯人网上赌场
  • 外围博彩
  • 博彩网站推广
  • 推广引流
  • 留痕程序出售
  • 谷歌推广引流技术
  • 推广引流方法
  • 美国在线赌场
  • 沙巴体育投注平台
  • 最新谷歌搜索留痕
  • 谷歌蜘蛛池排名技术
  • 网站推广方法
  • 留痕程序出售
  • 博彩推广方法
  • 菠菜论坛
  • 买球平台
  • 谷歌搜索留痕
  • 蜘蛛池排名
  • 博彩公司推广渠道
  • 谷歌搜索留痕
  • 博彩公司推广渠道
  • 真钱游戏
  • 网上赌球地址
  • 赌球平台推荐
  • 赌球网址
  • 博彩包网
  • 买球app
  • 澳门博彩公司
  • 威尼斯人赌场
  • 博彩平台推荐
  • 美国博彩网站
  • 缅甸实体赌场
  • 柬埔寨网上赌场
  • 柬埔寨在线赌场
  • 韩国博彩
  • 支持人民币的博彩公司
  • 世界五大比特币交易所
  • 欧易是哪个国家的
  • 中币跑路
  • 亚洲博彩公司
  • 合法网上赌场
  • 马尼拉赌场
  • 支持人民币的博彩公司
  • 大陆博彩平台
  • 澳门新葡京娱乐城
  • 老挝赌场
  • 世界赌场排名
  • 网上博彩公司排行
  • 菠菜论坛
  • 东南亚赌博网站
  • 虚拟币博彩
  • 澳门百家乐网址
  • 网上博彩导航
  • 区块链百家乐游戏
  • 马来西亚博彩公司
  • 越南赌场
  • 区块链百家乐
  • 香港娱乐场
  • 澳大利亚赌博网站
  • 足球赔率
  • 菲律宾网上赌场
  • 数字币博彩网站
  • 足球投注网站
  • 百家乐论坛
  • 皇冠体育博彩公司
  • 网上赌博网站
  • 网上博彩推广话术
  • 谷歌搜索快速方法
  • 网上博彩推广话术
  • 数字币赌场
  • 皇冠博彩公司
  • 世界杯博彩公司
  • 英国博彩公司
  • 网上博彩合法化
  • 新加坡赌场
  • 比特币网上赌场
  • 怎么洗钱
  • 加密货币博彩平台
  • 世界杯赌球网址
  • 网上赌球地址
  • 博彩推广方式
  • 印度尼西亚博彩公司
  • 国际包网
  • bbin平台直营
  • 亚洲体育博彩平台
  • 越南博彩公司
  • 百家乐路单
  • 澳门博彩官网
  • 博彩网推荐
  • 澳门太阳城网址
  • 百家乐网址
  • 世界杯赌球网址
  • 皇冠博彩网址
  • 洗钱方法
  • 买球网站
  • 欧洲杯赌球平台
  • 皇冠现金网
  • 外围赌球平台
  • 果敢赌场
  • 买球技巧
  • 全球最大博彩公司
  • 电子游艺
  • 真人电子游戏
  • 骰宝游戏规则
  • 亚洲体育博彩平台
  • 澳门在线赌场
  • 缅甸赌场地址
  • 赌球平台
  • 赌场如何赢钱
  • 世界杯买球网站
  • 真人牌九游戏
  • 世界杯买球官网
  • 时时彩平台
  • 六合彩预测
  • 威尼斯人网上赌场
  • 外围赌球网站
  • 赌博网址
  • 彩票群
  • 微信赌博群
  • 韩国首尔赌场
  • 赌钱游戏
  • 美国网上赌场
  • bbin官网
  • 沙巴体育官网
  • 博彩平台推荐
  • 数字币博彩网站
  • 比特币网上赌场
  • 世界赌场名单
  • 美国赌场攻略
  • 菠菜论坛排名
  • 菠菜论坛排名
  • 缅甸网上赌场
  • 支持人民币的博彩公司