0%
Hello World
发表于
更新于
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick Start
Create a new post
1 | $ hexo new "My New Post" |
More info: Writing
Run server
1 | $ hexo server |
More info: Server
Generate static files
1 | $ hexo generate |
More info: Generating
Deploy to remote sites
1 | $ hexo deploy |
More info: Deployment
AI入门笔记-循环序列模型
发表于
更新于
David Silver深度强化学习
发表于
更新于
深度学习介绍
大纲
- 关于课程
- 关于深度强化学习
- 深度强化学习问题
- 深入RL代理
- 深度强化学习的问题
关于课程(省略作业,考核等信息)
书籍:
■ An Introduction to Reinforcement Learning. Sutton and Barto. 1998
免费网络版(404)
免费网络版
Second edition in progress
■ Algorithms for Reinforcement Learning, Szepescari
Morgan and Claypool, 2010
免费网络版
常用命令笔记
发表于
更新于
Windows系列
进入测试模式(允许未签名驱动)
bcdedit /set testsigning on
AI入门笔记-卷积神经网络
发表于
更新于
AI入门笔记-改善深层神经网络:超参数调试、正则化以及优化
发表于
更新于
AI入门笔记-改善深层神经网络:超参数调试、正则化以及优化
发表于
更新于
AI入门笔记-神经网络和深度学习
发表于
更新于
深度学习概论
备注:常用词
logistic回归=逻辑回归=线性拟合
cost=误差=成本
1.1监督学习
数据类型 | 网络类型 | 应用例子 |
---|---|---|
线性数据 | 价格预测,广告预测 | 标准网络 |
图像数据 | Convolutional NN(CNN) | 图像处理 |
序列数据 | RNN | 音频、翻译 |
图像等 | 混合网络 | 自动驾驶 |
神经网络基础
2.1线性拟合
类似于机器学习的函数y=wx+b,有
$$ \hat{y} = \sigma (wx+b) \text {,输出函数} $$
$$ \sigma(z) = \frac{1}{1+e^{-z}} \text {,Sigmod函数} $$
函数图形类似arctanx,左边趋近于0,右边趋近于1
保证函数wx+b计算出的值(可能性)在有效区间(0-1)