重要性采样与重参数是深度强化学习算法中常用的统计学技巧,比较难理解,遂将一些解读记录如下。
重要性采样
重参数
利用行为策略产生的数据评估目标策略需要利用重要性采样方法。
参考链接
- 漫谈重参数:从正态分布到Gumbel Softmax,by 苏剑林.
- 重要性采样(Importance Sampling)详细学习笔记,by hehedadaq.
- PR Sampling Ⅰ: 蒙特卡洛采样、重要性采样及python实现,by 刘浚嘉.
重要性采样与重参数是深度强化学习算法中常用的统计学技巧,比较难理解,遂将一些解读记录如下。
利用行为策略产生的数据评估目标策略需要利用重要性采样方法。
Gym 是一个用于开发和比较强化学习算法的工具包。 它支持从步行到玩 Pong 或 Pinball 等游戏的代理的训练工作。
从库安装:
1 | pip install gym |
从源安装:
1 | git clone https://github.com/openai/gym |
1 | import gym |
OpenAI的Spinning Up项目仅在 Linux 和 OSX 上支持Spinning Up,因此想在Win10系统中安装Linux子系统,以便将Spinning Up项目运行起来,学习一下强化学习。
步骤如下:
步骤如下:
1 | sudo apt-get install x11-apps |
1 | # 创建虚拟环境 |
1 | conda activate spinningup |
1 | conda deactivate |
1 | sudo apt-get update && sudo apt-get install libopenmpi-dev |
1 | sudo apt-get install python-opengl |
1 | git clone https://github.com/openai/spinningup.git |
1 | # 运行登陆器 |
在玩FlightGear的过程中,可能需要将视景分角度投影到不同显示器上,或者在一个显示器窗口上投影不同角度的视景。下面记录该需求实现方法。
在FGDATA文件夹根目录下创建camera-views.xml文件夹,写入如下内容:
1 | <?xml version="1.0"?> |
在FGDATA文件夹根目录下找到defaults.xml配置文件,修改如下配置内容,加入camera-views.xml配置文件。
1 | <rendering include="camera-views.xml"> |
在FGDATA文件夹根目录下创建camera-views.xml文件夹,写入如下内容:
1 | <?xml version="1.0"?> |
在FGDATA文件夹根目录下找到defaults.xml配置文件,修改如下配置内容,加入camera-views.xml配置文件。
1 | <rendering include="camera-views.xml"> |
GNU Privacy Guard(GnuPG或GPG)是一个密码学软件,用于加密、签名通信内容及管理非对称密码学的密钥。GnuPG是自由软件,遵循IETF订定的OpenPGP技术标准设计,并与PGP保持兼容。
对于 Windows 的用户:
如果您使用 Windows, 下载 Gpg4win并运行其安装包。
为了验证签名,您需要在 Windows 命令行(“cmd.exe”)中输入一些命令。
对于 macOS 的用户:
如果您正在使用 macOS,您可以安装 GPGTools。
为了验证签名,您需要在(“应用程序”下的)终端中输入一些命令
对于 GNU/Linux 的用户:
如果你使用 GNU/Linux,那么可能在你的系统中已经安装了 GnuPG,因为大多数 Linux 发行版都预装了它。
GnuPG使用非对称密码体制算法生成一对密钥对,其中公钥可公开,私钥必须保密。
1 | gpg --gen-key |
验证下载文件的第一步是与任何提供文件下载的人建立信任。出于此,需要下载这个文件的公钥,并且验证公钥的拥有者是否是他或者她自称的。
在下载完文件拥有者的公钥后,使用 gpg 命令导入公钥到你的 keyring 中:
1 | gpg --import signing-key.asc |
记录各类Office使用技巧,以备使用。
做科研的小伙伴们在使用matlab绘制飞行器轨迹时,总是感叹大牛绘制的图美观大方,而自己绘制的图则简陋到了极点。但现在有了flypath3d,导师再也不用担心我的绘图了。
flypath3d打包了一个免费的Matlab软件,用于导弹和空中目标轨迹的3D可视化,为计算机仿真提供了可视参考。 由于其多功能性和易用性,该软件可以帮助产生有吸引力的演示文稿,以用于各种科学或公共宣传目的。该软件可免费用于科学和教育用途。 您也可以出于任何目的修改和/或分发此软件。 但是,使用包装时,请记住引用该论文。
该包由使用“ package_setup”命令安装在Matlab环境中的几个M代码文件组成。 它提供了通过放置连续的对象来构造复杂的3D场景的功能,这些对象实际上在布局中起到了构建块的作用。
下载flypath3d软件包并将其解压缩到目标目录。 接下来执行配置脚本:
1 | package_setup |
这样,flypath3d就安装好了,可以开始使用它了。
MongoDB是一种NoSQL类型数据库,与关系型数据库相比,它具有很强的灵活性,无需类似Sequelize这样的ORM库,即可直接访问。例如,使用nodejs访问MongoDB:
1 | const { MongoClient } = require("mongodb"); |
尽管MongoDB很灵活,但在设计其数据模型时,为了确保数据组织的一致性,应遵循一下原则:
请参考以下代码:
1 | var departments = await dbConnect.collection("departments").find({}, { |
记录Hexo使用过程的一些经验。
请参考Asset Folders。
请参考Hexo博客Next主题站内搜索模块相关,解决搜索无效、一直loading的问题。
Hexo 版本 | 最低兼容 Node.js 版本 |
---|---|
6.0+ | 12.13.0 |
5.0+ | 10.13.0 |
4.1 - 4.2 | 8.10 |
4.0 | 8.6 |
3.3 - 3.9 | 6.9 |
3.2 - 3.3 | 0.12 |
3.0 - 3.1 | 0.10 or iojs |
0.0.1 - 2.8 | 0.10 |