「设计模式」 抽象工厂
抽象工厂
//单核
class SingleCore
{
public:
virtual void Show() = 0;
};
class SingleCoreA: public SingleCore
{
public:
void Show() { cout<<"Single Core A"<<endl; }
};
class SingleCoreB :public SingleCore
{
public:
void Show() { cout<<"Single Core B"<<endl; }
};
//多核
class MultiCore
{
public:
virtual...
语音端点识别
又叫语音活性检测(voice-activity-detector,VAD,speech activity detection,speech detection);
目的:过滤音频中的静默片段(非语音片段);
一、 基本思路
1. 预处理
本操作可选,但实验表明,对数据进行预处理之后的效果要比不进行预处理的效果好;可以对数据进行去除直流和加窗两个预处理;
2. VAD
不同的 VAD 算法具有不同的延迟时间、灵敏度、精度和计算成本;有些 VAD 算法也提供了进一步的分析,例如讲话是否浊音、清音或持续;
基于短时能量和过零率的双门限端点检测(最简单的方法)
为能量和过零率分别取两个门限——低门限和高门限;
(1) 利用过零率检测清音,用短时能量检测浊音;
(2)...

程序员推荐书籍
阅读这些书可以帮助你避免一些常见的陷阱和错误,一些开发人员早期经历的陷阱和犯过的错误;
一、 建议
摘自「讨论一下《C++ 编程思想》这本书」1讨论帖子中的一段,个人很喜欢;
学习编程最好的方法之一就是阅读源代码;
不要停留在集成开发环境的摇篮上,要学会控制集成开发环境,还要学会用命令行方式处理程序;
初学编程建议
浮躁的人容易说:XX 语言不行了,应该学 YY;——是你自己不行了吧!?
11.浮躁的人容易问:我到底该学什么;——别问,学就对了;
浮躁的人容易问:XX 有钱途吗;——建议你去抢银行;
浮躁的人容易说:我要中文版!我英文不行!——不行?学呀!
浮躁的人容易问:XX 和 YY 哪个好;——告诉你吧,都好——只要你学就行;
浮躁的人...
「ML」性能度量
每个评估指标都有其价值,但如果只使用单一的指标,往往会的出片面甚至错误的结论;所以使用互补的指标才能更好地解决实际问题;
基本概念
1. 错误率与精度
2. 查准率、查全率和 F1
(1) P-R 图
3. ROC 和 AUC
4. 代价敏感错误率与代价曲线
分类精度
当我们使用“准确性”这个术语时,指的就是分类精度。它是正确预测数与样本总数的比值。
只有当属于每个类的样本数量相等时,它才有效。
例如,假设在我们的训练集中有98%的A类样本和2%的B类样本。然后,我们的模型可以通过简单预测每个训练样本都属于A类而轻松获得98%的训练准确性。
当在60%A级样品和40%B级样品的测试集上采用相同的模型时,测试精度将下降到60%。分类准确度很重要,但是它有时会带给我...
「论文解读」Fully Supervised Speaker Diarization
只要开始发言,每个说话者都会建立一个属于他的 RNN(递归神经网络) 模型,然后在过程中,不断更新相应的 RNN 状态;
论文发表时间:2018年10月
论文地址:https://arxiv.org/abs/1810.04719
官方代码:https://github.com/google/uis-rnn(pytorch)
一、一句话总结
第一句:论文提出了无限交替循环神经网络(UIS-RNN),解决了以往人声分割算法无法进行监督训练的问题;
第二句:EER 在 NIST SRE 2000 CALLHOME 上达到了 7.6%,比先前的基于聚类的方法(8.8%)和深度网络嵌入方法(9.9%)好;
二、Q&A
三、贡献
四、结论
遇到带标签的...
共计 516 篇文章,26 页。