主页

「Python」 ffmpeg

官方文档 https://ffmpeg.org/documentation.html github:https://github.com/kkroening/ffmpeg-python API: https://kkroening.github.io/ffmpeg-python/ 功能:; 一、 安装 pip install ffmpeg-python 参考 ffmpeg 安装 —— mp3 End 附录 A 示例 1. 打开视频文件 B 参考文献

阅读更多

「ML」 基学习器

一、 基分类器 1. 常用的基分类器1 最常用的基分类器是「决策树」: 决策树不稳定,适合用集成学习来提升效果; 除了决策树以外,神经网络也很适合; 2. 可否将随机森林中的基分类器由决策树替换为线性分类器或 KNN?1 随机森林属于 Bagging 类的集成学习;Bagging 最大的好处就是集成后,分类器方差更小; 而线性分类器和 KNN 都是较为稳定的分类器,本身方差就不大;使用 Bagging 后并不能获得更好的表现;甚至可能因为 Bagging 的采样,而导致他们在训练中更难收敛,从而增大了集成分类器的偏差; End 附录 A 推荐资料 B 参考资料 诸葛越. 百面机器学习[M]. 北京:人民邮电出版社. 2018. ...

阅读更多

「ML」 集成学习

集成学习是一大类模型融合策略的统称;对于弱分类器往往效果显著; 其中每一个单独的分类器称为「基分类器」,也叫「基学习器」; 较为成功的应用就是 XGBoost; 常见问题汇总 集成学习的种类 :o: 集成学习分哪几种?有何异同? [Boosting] [Bagging] [基分类器] 集成学习的步骤和例子 :o: 集成学习的基本步骤?并举例 [集成学习] [Adaboost] [梯度提升决策树] 基分类器 :o: 常用的基分类器? :o: 可否将随机森林中的基分类器由决策树替换为线性分类器或KNN?为什么? [随机森林] [偏差-方差关系] 偏差与方差 :o: 什么是偏差和方差? :o: 从减小方差和偏差的角度解释 Boos...

阅读更多

「工具」 文献管理

一、 制作 RSS 源 有很多方法,此处仅介绍 feed43 二、 订阅 RSS 1. 常用 RSS 服务:Inoreader,feedly 二者功能差不多,择一即可;注册帐号即可使用; 以 Inoreader 为例: 当订阅源发生修改后,Inoreader 的显示信息不会再更新,但是订阅的内容会更新; 2. 常用 RSS 阅读客户端软件 iOS:reader 3 Android:FeedMe 使用 Inoreader 账号时,出现 Inoreader 无法登录,这是早期版本的bug,升级到3.9+就好了; Inoreader oauth 登录是官方授权方式,需定期手动授权;Inoreader 方式是本地存储帐号密码,定期自动登录; Windows:FeedDem...

阅读更多

「DL」 深度学习资料汇总

1 资料 1.1 推荐书籍 1.2 推荐资料 Convolutional Neural Network (CNN) NVIDIA 博客; 1.3 常用网站 使用 RSS 订阅以下网站 关注 DL 最新动向 arxiv: https://arxiv.org/list/cs.CV/recent, https://arxiv.org/list/cs/new recent 包含最新发布的论文;new 包含最新更新的论文(发布和覆盖);二者都是每周一至周五更新; reddit ML: https://www.reddit.com/r/MachineLearning/comments/807ex4/d_machine_learning_wayr_what_are_you_re...

阅读更多

「DLFramework」 TensorRT 入门

TensorRT 是 NVIDIA 发布的推理框架,用于在 NVIDIA GPUs 上进行深度学习模型部署;针对 NVIDIA 显卡做了优化;支持 TensorFlow、Caffe、PyTorch、MXnet、CNTK等所有主流框架及 ONNX; 官网: https://developer.nvidia.com/tensorrt ONNX TensorRT: https://github.com/onnx/onnx-tensorrt 官方文档汇总: https://docs.nvidia.com/deeplearning/sdk/tensorrt-archived/index.html, python API: https://docs.nvidia.com/deeplearning/...

阅读更多

「DLFramework」 NCNN 入门

腾讯 2017 年 7 月 开源的面向移动端的深度学习框架 github: https://github.com/Tencent/ncnn document: https://github.com/Tencent/ncnn/wiki 支持语言: C++ 支持框架: mxnet, caffe, onnx(pytorch) 支持平台: 跨平台 ios/linux/windows,主要支持 Android;

阅读更多

「DLFramework」 Mace 入门

mace 是 2018年4月小米开源的移动端深度学习框架; github: https://github.com/XiaoMi/mace document: https://mace.readthedocs.io/en/latest/ model zoo: https://github.com/XiaoMi/mace-models

阅读更多

「Python」 xml.etree.ElementTree

Python 3.5.6 官方文档:https://docs.python.org/3.5/library/xml.etree.elementtree.html parse iter findall start end close data XML XMLID Element SubElement Comment tostring extend write 获取根节点:ET.XML(...

阅读更多

「Python」 sqlite3:嵌入式关系数据库

Python 3.5.6 官方文档:https://docs.python.org/3.5/library/sqlite3.html API 一、 Hello World 示例 End 附录 A API B 示例 1. hellow world C 参考资料 Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.

阅读更多

「Python」 shelve:对象的持久存储

使用 pickle 在 DBM 数据库中存储数据; Python 3.5.6 官方文档:https://docs.python.org/3.5/library/shelve.html API 一、 Hello World 示例 End 附录 A API B 示例 1. hellow world C 参考资料 Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.

阅读更多

「Python」 pickle:对象序列化

对任意的 python 对象进行序列化(将对象转换成二进制流)和反序列化; Python 3.7.2 官方文档:https://docs.python.org/3/library/pickle.html API 一、 Hello World 示例 序列化之后的数据可以写到文件、套接字、管道或其他位置; 反序列化时要保证该对象的定义在当前进程中可见,否则序列化会报错; 并不是所有对象都能够序列化; 套接字、文件句柄、数据库链接以及其他运行时状态,这些依赖于操作系统或其他进程的对象,无法保存; 循环引用 End 附录 A API B 示例 1. hellow world import pickle import pprint data = [{'a':'...

阅读更多

「Python」 marshal:Python 内部对象序列化

最原始的序列化工具;主要是为了支持 python 的 .pyc 文件; Python 3.5.6 官方文档:https://docs.python.org/3.5/library/marshal.html API 一、 Hello World 示例 End 附录 A API B 示例 1. hellow world C 参考资料 Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.

阅读更多

「Python」 dbm:UNIX 键-值数据库

Python 3.5.6 官方文档:https://docs.python.org/3.5/library/dbm.html API 一、 Hello World 示例 End 附录 A API B 示例 1. hellow world C 参考资料 Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.

阅读更多

「Python」 数据存储和解析

数据的存储和使用包括两方面:数据在内存中的表示及格式间的转换,和数据存储区的处理; Python 3.5.6 官方文档:https://docs.python.org/3.5/library/persistence.html 一、 数据存储和解析简介 1. 序列化 serializing,将数据转换为一种可传输或可存储的格式; 这些功能集成在 pickle 和 marshal 中;其中,pickle 更为常用,因为他可以和存储序列化数据的库(如 shelve)集成;而对于 web 的应用,json 更为常用,因为他可以和 web 服务存储工具很好的集成在一块; 2. 存储数据 不需要索引的情况下,直接存储即可; 需要使用键值索引的,常用 DBM 来处理; ...

阅读更多

「Python」 csv:逗号分割文件

Python 3.5.6 官方文档:https://docs.python.org/3.5/library/csv.html API 一、 Hello World 示例 End 附录 A API B 示例 1. hellow world C 参考资料 Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.

阅读更多