题目内容
(请给出正确答案)
[单选题]
考虑以下场景:AiphaGo通过自我博弈进行学习。根据强化学习的简单定义,以下哪个选项属于行动(action)()?
A.落子的位置
B.最终的胜负
C.棋盘棋子的布局
D.当前领先的日数
答案
查看答案
A.落子的位置
B.最终的胜负
C.棋盘棋子的布局
D.当前领先的日数
第1题
A.价值对规律和事实的引导
B. 通过政府管制
C. 修正在还原过程中简化的抽象,引入心理和精神因素
D. 社会各阶层之间的博弈和妥协
第2题
第3题
A.策略博弈的本质在于团体协作
B.博弈的过程中参与者相互影响制约
C.博弈中每一步的结果都直接影响全局
D.博弈过程中要为他人设身处地地考虑
第4题
A.策略博弈的本质在于团体协作
B.博弈的过程中参与者相互影响制约
C.博弈中每一步的结果都直接影响全局
D.博弈过程中要为他人设身处地地考虑
第5题
者"的最后通牒博弈:首先由一个唯一指定的“提议者”提出一个分配提议一从总量为I的财富中分给反应者s,剩下的I-s留给提议者自己:其次,由n-1个"反应者"同时决定自己是否接受这个提议,如果没有人接受,则所有参与者什么也得不到;如果至少有一个人接受,则所有接受的反应者以等概率地(如通过抓阄)得到s,提议者得到1-s.假设11.4节(9)式定义的βi<(n-1)/n,给出这个博弈的均衡。
第6题
A.ARP实现机制只考虑正常业务交互,正确非正常业务交互或恶意行为不做任何验证
B.ARP欺骗攻击只能通过ARP应答来实现,无法通过ARP请求实现
C.当某主机发送正常ARP请求时,攻击者会抢先应答,导致主机建立一个错误的IP和MAC映射关系
D.ARP静态绑定是解决ARP欺骗攻击的一种方案,主要应用在网络规模不大的场景
第8题