猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态

设为首页| 加入收藏

yobo体育app官方下载
  • Welcome!
猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态
作者:admin 发布日期:2021-07-12

本文经AI新媒体量子位(公多号ID:QbitAI)授权转载,转载请有关出处。

这岁首,就连喵星人也有本身的语音数据集了。

没错,来自米兰大学计算机系的几位猛男,和生物系、兽医系的幼友人们一首,搜集了21只猫咪的400+条语音数据,做了个猫叫声数据集。

这21只猫咪中,包括10只成年缅因猫和11只成年欧洲短毛猫,是长毛和短毛猫咪中的代外类型。

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

△缅因猫vs欧洲短毛猫

不少网友下载后外示:

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

痴汉乐半幼时了,根本干不了活啊!

3栽猫咪叫声,总长21分钟

制作这个数据集的初衷,是为了人类能更益地理解猫咪叫声的含义,为以后的人-猫疏导作准备。

所以,在制作数据集时,钻研者们选择了3栽让猫发出分别叫声的场景:

期待投喂:主人喂食前的猫叫声。 被放到生硬环境下阻隔:将猫运送到一个生硬环境,车程不超过半幼时,被阻隔前会与主人先相处半幼时。阻隔时的猫会发出叫声。 刷牙:主人给猫刷牙时的猫叫声。

在这些场景中,每次搜集猫叫的时间不超过5分钟(例如,5分钟后就会给猫喂食)。

为了让语音数据更清亮、且不影响猫的平时走动,钻研者们采用了一个不到50g的幼型麦克风,挂在猫脖子上。

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

在消弭了不包含猫叫声的片段后,钻研者们将这些叫声录音剪切成平均长度1.82s、方差0.37s旁边的录音文件,共448个片段,其中缅因猫196个,欧洲短毛猫是252个,总时长约21分钟。

这是搜集到的3栽类型的叫声,从左至右挨次为期待投喂、被阻隔和刷牙:

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

为了实在识别猫咪在这3栽情况下的叫声,钻研者们还做了一个机器学习模型。

无关猫咪栽类,识别成果90%以上

钻研者们采用了模式识别的手段,算法框架是一个有向无环图。

浅易来说,先区分猫叫声是否属于“等投喂”和“被阻隔”两栽状态,再识别它们是否属于“刷牙”的状态。

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

为了验证哪栽模型对于识别3栽猫咪语音状态更有效,钻研者们采用了分别的模型进走实验,末了确定了有向无环图中的隐马尔科夫模型,识别率最高能达到95.94%。

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

通过实验,“期待投喂”的猫咪叫声能被完善识别,达到了100%;“刷牙”的猫咪叫声识别率达到了第二,平均在95.24%,有必定概率被识别成“期待投喂”;“被阻隔”的猫咪叫声识别率在92.59%,有必定概率被识别成“刷牙”。

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

三栽状态的识别成果都在90%以上,也算是一个不错的模型了。

这项钻研、以及猫叫数据集的制作,来自米兰大学计算机系的3位猛男,以及生物学系和兽医系的幼友人们,一切人在这项钻研中的贡献相通。

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源 网友:哪有意理搞科研

发现这个数据集后,不少网友第一逆答:居然连这都有?

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

已经有网友,最先试图搞懂、甚至已经听懂数据集的“详细内容”了:

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

有网友嗅到了内里的商机:

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

还有网友调侃,根本没情感搞科研,只剩喜悦了。

自然,除了猫咪叫声,也有不少网友挑出,想要其他的声音数据集:

猛男把400+条猫咪叫声做成数据集,可识别猫的3栽分别状态丨开源

对猫咪叫声乐趣味的良朋,戳下方地址即可获取~

猫叫数据集传送门: https://zenodo.org/record/4008297#.YNFSEhMzaPf

【编辑选举】印刷工艺简介

企业将营业迁移到云平台时面临的五个坦然挑衅 希捷2021 Datasphere线上峰会:生态友人携手开启数据新径界,激活数据深价值 6.4 添载数据集 6.5 保存数据集 自动化可隐微挑高数据中央运营效率

Powered by yobo体育app官方下载 @2013-2021 RSS地图 HTML地图