「Python」 ffmpeg
官方文档 https://ffmpeg.org/documentation.html
github:https://github.com/kkroening/ffmpeg-python
API: https://kkroening.github.io/ffmpeg-python/
功能:;
一、 安装
pip install ffmpeg-python
参考 ffmpeg 安装 —— mp3
End
附录
A 示例
1. 打开视频文件
B 参考文献
「ML」 基学习器
一、 基分类器
1. 常用的基分类器1
最常用的基分类器是「决策树」:
决策树不稳定,适合用集成学习来提升效果;
除了决策树以外,神经网络也很适合;
2. 可否将随机森林中的基分类器由决策树替换为线性分类器或 KNN?1
随机森林属于 Bagging 类的集成学习;Bagging 最大的好处就是集成后,分类器方差更小;
而线性分类器和 KNN 都是较为稳定的分类器,本身方差就不大;使用 Bagging 后并不能获得更好的表现;甚至可能因为 Bagging 的采样,而导致他们在训练中更难收敛,从而增大了集成分类器的偏差;
End
附录
A 推荐资料
B 参考资料
诸葛越. 百面机器学习[M]. 北京:人民邮电出版社. 2018. ...
「ML」 集成学习
集成学习是一大类模型融合策略的统称;对于弱分类器往往效果显著;
其中每一个单独的分类器称为「基分类器」,也叫「基学习器」;
较为成功的应用就是 XGBoost;
常见问题汇总
集成学习的种类
集成学习分哪几种?有何异同?
[Boosting] [Bagging] [基分类器]
集成学习的步骤和例子
集成学习的基本步骤?并举例
[集成学习] [Adaboost] [梯度提升决策树]
基分类器
常用的基分类器?
可否将随机森林中的基分类器由决策树替换为线性分类器或KNN?为什么?
[随机森林] [偏差-方差关系]
偏差与方差
什么是偏差和方差?
从减小方差和偏差的角度解释 Boos...






「工具」 文献管理
一、 制作 RSS 源
有很多方法,此处仅介绍 feed43
二、 订阅 RSS
1. 常用 RSS 服务:Inoreader,feedly
二者功能差不多,择一即可;注册帐号即可使用;
以 Inoreader 为例:
当订阅源发生修改后,Inoreader 的显示信息不会再更新,但是订阅的内容会更新;
2. 常用 RSS 阅读客户端软件
iOS:reader 3
Android:FeedMe
使用 Inoreader 账号时,出现 Inoreader 无法登录,这是早期版本的bug,升级到3.9+就好了;
Inoreader oauth 登录是官方授权方式,需定期手动授权;Inoreader 方式是本地存储帐号密码,定期自动登录;
Windows:FeedDem...
「DL」 深度学习资料汇总
1 资料
1.1 推荐书籍
1.2 推荐资料
Convolutional Neural Network (CNN) NVIDIA 博客;
1.3 常用网站
使用 RSS 订阅以下网站 关注 DL 最新动向
arxiv: https://arxiv.org/list/cs.CV/recent, https://arxiv.org/list/cs/new
recent 包含最新发布的论文;new 包含最新更新的论文(发布和覆盖);二者都是每周一至周五更新;
reddit ML: https://www.reddit.com/r/MachineLearning/comments/807ex4/d_machine_learning_wayr_what_are_you_re...
「DLFramework」 TensorRT 入门
TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX;
官网: https://developer.nvidia.com/tensorrt
ONNX TensorRT: https://github.com/onnx/onnx-tensorrt
官方文档汇总: https://docs.nvidia.com/deeplearning/sdk/tensorrt-archived/index.html,
python API: https://docs.nvidia.com/deeplearning/...
「DLFramework」 NCNN 入门
腾讯 2017 年 7 月 开源的面向移动端的深度学习框架
github: https://github.com/Tencent/ncnn
document: https://github.com/Tencent/ncnn/wiki
支持语言: C++
支持框架: mxnet, caffe, onnx(pytorch)
支持平台: 跨平台 ios/linux/windows,主要支持 Android;
「DLFramework」 Mace 入门
mace 是 2018年4月小米开源的移动端深度学习框架;
github: https://github.com/XiaoMi/mace
document: https://mace.readthedocs.io/en/latest/
model zoo: https://github.com/XiaoMi/mace-models
「Python」 xml.etree.ElementTree
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/xml.etree.elementtree.html
parse
iter
findall
start
end
close
data
XML
XMLID
Element
SubElement
Comment
tostring
extend
write
获取根节点:ET.XML(...
「Python」 sqlite3:嵌入式关系数据库
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/sqlite3.html
API
一、 Hello World
示例
End
附录
A API
B 示例
1. hellow world
C 参考资料
Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.
「Python」 shelve:对象的持久存储
使用 pickle 在 DBM 数据库中存储数据;
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/shelve.html
API
一、 Hello World
示例
End
附录
A API
B 示例
1. hellow world
C 参考资料
Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.
「Python」 pickle:对象序列化
对任意的 python 对象进行序列化(将对象转换成二进制流)和反序列化;
Python 3.7.2 官方文档:https://docs.python.org/3/library/pickle.html
API
一、 Hello World
示例
序列化之后的数据可以写到文件、套接字、管道或其他位置;
反序列化时要保证该对象的定义在当前进程中可见,否则序列化会报错;
并不是所有对象都能够序列化;
套接字、文件句柄、数据库链接以及其他运行时状态,这些依赖于操作系统或其他进程的对象,无法保存;
循环引用
End
附录
A API
B 示例
1. hellow world
import pickle
import pprint
data = [{'a':'...
「Python」 marshal:Python 内部对象序列化
最原始的序列化工具;主要是为了支持 python 的 .pyc 文件;
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/marshal.html
API
一、 Hello World
示例
End
附录
A API
B 示例
1. hellow world
C 参考资料
Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.
「Python」 dbm:UNIX 键-值数据库
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/dbm.html
API
一、 Hello World
示例
End
附录
A API
B 示例
1. hellow world
C 参考资料
Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.
「Python」 数据存储和解析
数据的存储和使用包括两方面:数据在内存中的表示及格式间的转换,和数据存储区的处理;
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/persistence.html
一、 数据存储和解析简介
1. 序列化
serializing,将数据转换为一种可传输或可存储的格式;
这些功能集成在 pickle 和 marshal 中;其中,pickle 更为常用,因为他可以和存储序列化数据的库(如 shelve)集成;而对于 web 的应用,json 更为常用,因为他可以和 web 服务存储工具很好的集成在一块;
2. 存储数据
不需要索引的情况下,直接存储即可;
需要使用键值索引的,常用 DBM 来处理;
...
「Python」 csv:逗号分割文件
Python 3.5.6 官方文档:https://docs.python.org/3.5/library/csv.html
API
一、 Hello World
示例
End
附录
A API
B 示例
1. hellow world
C 参考资料
Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.
共计 516 篇文章,26 页。