杨文龙的博客 » Blog Archive » 蒙特卡洛树搜索（Monte Carlo tree search） - 个人技术笔记 - 热爱创新发明，专注机器学习、算法、深度学习、自然语言处理及人工智能

蒙特卡洛树搜索（Monte Carlo tree search）

发布时间：2016-06-27 栏目：人工智能评论：0 Comments

蒙特卡洛树搜索（英语：Monte Carlo tree search；简称：MCTS）是一种用于某些决策过程的启发式搜索算法，最引人注目的是在游戏中的使用。一个主要例子是电脑围棋程序，它也用于其他棋盘游戏、即时电子游戏以及不确定性游戏。

蒙特卡洛树搜索的每个循环包括四个步骤：

选择（Selection）：从根结点 $R$ 开始，选择连续的子结点向下至叶子结点 $L$ 。下面的结点有更多选择子结点的方法，使游戏树向最优点扩展移动，这是蒙特卡洛树搜索的本质。
扩展（Expansion）：除非任意一方的输赢导致游戏结束，否则 $L$ 会创建一个或多个子结点或从结点 $C$ 中选择。
仿真（Simulation）：在结点 $C$ 中进行随机布局。
反向传播（Backpropagation）：使用布局结果更新从 $C$ 到 $R$ 的路径上的结点信息。

蒙特卡罗方法的特点则有：

可以从经验中学习不需要环境模型
状态值函数的估计是相互独立的
只能用于episode tasks

留下评论

You must be logged in to post a comment.

相册集

关于自己

杨文龙，微软Principal Engineering Manager, 曾在各家公司担任影像技术资深总监、数据科学团队资深经理、ADAS算法总监、资深深度学习工程师等职位，热爱创新发明，专注于人工智能、深度学习、图像处理、机器学习、算法、自然语言处理及软件等领域，目前发明有国际专利19篇，中国专利28篇。

联系我

个人技术笔记

welonshen@gmail.com

2015 in Shanghai

个人技术笔记

蒙特卡洛树搜索（Monte Carlo tree search）

留下评论

近期文章

近期评论

文章归档

分类目录

功能

热情读者

作者其他介绍

友情链接

相册集

关于自己

联系我