主页

「Python」 copyreg

Python 3.5.6 官方文档:https://docs.python.org/3.5/library/copyreg.html API 一、 Hello World 示例 End 附录 A API B 示例 1. hellow world C 参考资料 Doug Hellmann 著, 苏金国, et al 译. Python3 标准库[M]. 北京:机械工业出版社, 2018.

阅读更多

「Python」 Matplotlib

官网 https://matplotlib.org/ 功能:一个二维图像绘制库; 一、 安装 pip install matplotlib 二、 基本操作 fig = plt.gcf() #获取当前figure plt.close() # 关闭 window,如果没有指定,则指当前 window plt.clf() # 清除当前 figure 的所有axes,但是不关闭这个 window,所以能继续复用于其他的 plot plt.cla() # 清除axes,即当前 figure 中的活动的axes,但其他axes保持不变 三、 Issue 内存泄漏 1) 问题:pyplote 的 plot 操作内存泄漏; close(fig) 并没有起作用; 2) 解决:gc.col...

阅读更多

「AI」 人工智能资料汇总

1 数据隐私 Large image datasets: A pyrrhic win for computer vision? 2020-06-24 paper | code-official 声讨了 CV 领域多个数据集,指出其在政治上的问题,并给出了一些建议; 导致了 Tiny Images Dataset 直接下架;而去年 MS Celeba 1M 也已下架; B 推荐资料

阅读更多

「ML」 K 均值聚类

:o: 简述 K 均值算法的具体步骤 :o: K 均值算法的优缺点是什么,要如何对其进行调优 :o: 针对 K 均值算法的缺点,有哪些改进的模型 :o: 证明 K 均值算法的收敛性 一、了解 K-Means 1. 定义 基本步骤: 预处理; 随机选取 k 个聚类中心; 定义 loss 函数; 训练 更新样本 更新聚类中心 2. 优缺点 缺点: 受离群点和初值影响,每次结果都不稳定; 离群点和少量噪声都会对均值产生较大影响,导致中心点偏移; 结果通常是局部最优,而不是全局最优; 无法很好地解决样本不均衡的情况; 不太适用于离散分类; 只能发现凸集(所有基于划分的聚类方法的共性) 3. 优化...

阅读更多

「算法」 并查集

又叫 Disjoint Set,Union-Find ALgorithm; 一、 算法讲解 并查集是为了解决什么问题; End 附录 A 示例 1. 二分查找 C 示例 B 参考文献

阅读更多

「算法」概览

一、 介绍 二、 在线提交系统 LeetCode 面试常用; 浙江大学 Online Judge(ZOJ) 国内最早也是最有名气的OJ,有很多高手在上面做题。特点是数据比较刁钻,经常会有你想不到的边界数据,很能考验思维的全面性; 北京大学 Online Judge(POJ) 建立较晚,但题目加得很快,现在题数和ZOJ不相上下,特点是举行在线比赛比较多,数据比ZOJ上的要弱,有时候同样的题同样的程序,在ZOJ上WA,在POJ上就能AC; 同济大学 Online Judge (TOJ) 这个OJ题数上不能与上两个相比,推荐这个OJ的原因是它是中文的,这对很多对英文不太感冒的兄弟是个好消息吧。它也因此吸引了众...

阅读更多

「LeetCode」 二分查找

要求:待搜索序列有序; 二分查找解读 一、 找位置 这类题目一般是说找到一个数它应该在数组中的位置,就是完整的套用框架;变化点就在返回 left 还是 right,判断时 = 是在哪一个哨兵上起作用; 1. Search Insert Position ID 35:在有序数组中找值,如果不存在则返回该值本应所处的位置; 就是二分查找中「查找第一个等于或者大于 key 的元素」 2. First Bad Version ID 278:上一题「Search Insert Position」的另一种描述; 3. Find First and Last Position of Element in Sorted Array ID 34:找到一个升序数组中指定数的左右边界;时间复杂度为...

阅读更多

「算法」 二分查找

要求:待搜索序列有序; 优势:将原本的线性时间提升到了对数时间范围; 一、 算法讲解 将查找的键和数组(默认升序排列)的中间键作比较,如果被查找的键小于中间键,就在左子数组继续查找;如果大于中间键,就在右子数组中查找,否则中间键就是要找的元素; binary_search, lower_bound, equal_range c 示例,python 示例 二、 关键点 二分查找法的写法并不唯一,主要可以变动地方有四处: high 的初始化,可以写成 nums.size() 或者 nums.size() - 1; low 和 high 的关系,可以写成 low < high 或者 low <= high; 更新 high 的赋值,可以写成 high = ...

阅读更多

「竞赛」 智能盘点—钢筋数量AI识别

2019数字中国创新大赛(Digital China Innovation Contest, DCIC 2019)共两批,六个赛道;第一批两个赛道于 2019年01月10号发布;第二批四个赛道于 2019年01月下旬发布;本赛道为钢筋计数; 竞赛主页:https://www.datafountain.cn/competitions/332/details baseline:Retinanet https://github.com/spytensor/detect_steel_bar 一、 介绍 本赛题基于广联达公司提供的钢筋进场现场的图片和标注,希望参赛者综合运用计算机视觉和机器学习/深度学习等技术,实现拍照即可完成钢筋点根任务,大幅度提升建筑行业关键物料的进场效率和盘点准确...

阅读更多

「Python」 threading:进程中管理并发操作

threading 基于 _thread 模块构建了更高级别的线程接口,; 源码:https://hg.python.org/cpython/file/3.5/Lib/threading.py API active_count current_thread get_ident enumerate main_thread settrace(func) setprofile(func) stack_size([size]) 常量:TIMEOUT_MAX 一、 Hello World 示例 threading.Th...

阅读更多

「Python」 multiprocessing:像线程一样管理进程

什么是 Multiprocessing 添加进程 Process 存储进程输出 Queue 效率对比 threading & multiprocessing 进程池 Pool map 示例,apply_async 示例,map 测试 共享内存 shared memory 进程锁 Lock End 附录 A 示例 1. map 示例 原始代码: def worker(id): return id**2 def Demo(length): for i in range(length): worker(i) 进程池代码: def poolDemo(length): p = Pool(processes=4) # proces...

阅读更多

「ML」 特征工程

附录 A 资料 特征工程的技巧 https://zhuanlan.zhihu.com/p/23356953 作者:Jacob Joseph 系列名称:Improving analytics output with feature engineering Part1: How to Improve Machine Learning: Tricks and Tips for Feature Engineering Part2: Enhance Machine Learning with Standardizing, Binning, Reducing Part3: Get instant access to actionable big data eBooks – for fre...

阅读更多