栏目分类
黔西南漳稳工程有限公司
伴热丝
表面贴装式保险丝
保险元器件
演示板
神奇动物在那处,但导演是微软
发布日期:2024-05-26 13:56    点击次数:56

一说到计算机视觉,大多数东说念主第一时期联念念到的等于“东说念主脸识别”、“自动驾驶“、说念路检测”等跟咱们平淡生活息息关联的要津词。而在2024年的5月末,微软在GitHub上头上传了这么一个计算机视觉的花式,透顶不包含这些要津词,却迷惑来了无数东说念主围不雅,短短两天时期就冲到了700颗星。

这个花式就是Pytorch-Wildlife。花式树立的初志是因为东说念主类行为导致大家生物万般性急剧下跌,对野活泼物种群的全面监控变得尤为遑急。

关联词念念要透顶诳骗东说念主力,来对某一种群或者某一块栖息地进行24小时监控,这澄莹是不实验的。不单是是因为资本过于腾贵,而是东说念主类肉眼很难竣工不雅察澄莹一些步履迅敏的动物,这就会导致莫得主见准确记载物种以及栖息地情况。于是在这个大布景下,Pytorch-Wildlife出身了。

PyTorch-Wildlife是一个用于创建、修改和分享巨大 AI 保护模子的平台。这些模子可用于各式应用,包括相机陷坑图像(当检测到动物经逾期进行拍照)、俯瞰图像、水下图像以及生物声学。庸碌来讲,花式是诳骗数据集和深度学习架构来终了保护野活泼物的方向。

花式标旨趣其实并不复杂。领先,诳骗了Megadetector v5进行对象检测,这是一个事前测验好的模子,用以过滤掉空图像或含有非动物对象(如东说念主类和车辆)的图像。

图:亚马逊森林的动物

Megadetector是基于Yolov5检测模子架构,有益为动物检测瞎想的深度学习模子。卤莽处理来自不同地区和生态系统的大要300万张动物图像。

接下来,对所拍摄的视频和图像进行网络,把网络得到的数据喂给Megadetector v5进行识别筛选。其中,关于视频数据,每段视频按30fps的帧率被拆分红图像帧,如果原视频帧率低于30fps,则使用原始帧率。这种弃取不错均衡模子的伊始效果以及识别精确度。

针对检测到的动物对象,Pytorch-Wildlife会将它们编著并退换至256x256像素的尺寸,并把柄图像级别的标注为每个编著图像分拨标签。

大多数深度学习模子,尤其是卷积神经网罗(CNN),它对输入的素材是有严格表率的。256x256其实是一个常见的遴荐,因为它既能保抓一定的图像细节,又不会使计算职守过大。

在编著之后,诳骗Pytorch-Wildlife的分类微调模块,经受ResNet-50动作基础模子架构,进步履物的识别测验。测验缔造包括60个测验周期,批量大小为128,经受当场梯度下跌优化器,并设定学习率在每20个周期后衰减。

以交游看,开发者需要对模子进行微调,模子才卤莽更好地交融和区分特定的动物类别,晋升在骨子野活泼物监测任务中的识别准确率。而Pytorch-Wildlife框架提供的微调模块则简化了这也曾过,使得即使是莫得深厚时刻布景的究诘东说念主员,也能诳骗先进的深度学习时刻进步履物识别模子的定制化测验。

Pytorch-Wildlife团队准备两份案例,第一个是在亚马逊森林中检测动物。

亚马逊雨林是宇宙上最大的热带雨林,是地球上生物万般性最丰富的地区之一。亚马逊雨林里的动物数目短长常惊东说念主的,已知的动物种类超越了10万种,这包括鸟类、哺乳动物、爬步履物、两栖动物以偏激他无脊椎动物等。但是这个数字只是是已记载和形色的物种,当代学者普遍以为,还有千千万万甚而是数百万种动物物种尚未被发现和形色。由于亚马逊雨林的弥远和复杂性,新的物种仍在不断被发现,因此确凿的动物种类数目是一个不断变化且难以精确统计的数字。

Pytorch-Wildlife使用了一个包含41904张图像的数据集,这些图像遮掩了36个已标志的动物属,其中33569张用于测验,8335张用于考据。

在亚马逊雨林花式中,模子终澄莹92%的识别准确率,针对90%的数据集在98%的置信度阈值下正确量度。这意味着,大部分动物图像卤莽被准确分类,只好少许需要东说念主工审核。

除了亚马逊森林的案例外,Pytorch-Wlidlife还有一个在加拉帕戈斯群岛的花式。这个花式标布景相等专有,诚然加拉帕戈斯群岛的动物种类也好多,然而这个脆弱的生态系统正靠近外来入侵物种的首要胁迫,这些物种可能改革土产货品种的种群动态并导致它们清除。

Pytorch-Wlidlife检测到,一些负鼠通过船只、陆地等技能,正在入侵加拉帕戈斯群岛的生态。对土产货生物组成了竞争压力,因此连气儿的监测和经管关于保管生态均衡至关要害。

花式中使用的数据集包含491471段视频,这些视频被标志为“负鼠”或“非负鼠”。数据集被永别为测验集和考据集,分别包含343053段和148418段视频。

经过考据,Pytorch-Wildlife平台测验的模子针对入侵的负鼠识别达到了98%的准确率。比如底下两张图,由于是夜间拍摄的起因,即等于东说念主的肉眼也很难第一时期分清两种动物。第一张图片是当地的食蚁兽,第二张是外来入侵物种负鼠。

图:食蚁兽

图:负鼠

Pytorch-Wildlife在监控和识别上初步得到了收效,不外这关于保护生态均衡上来说澄莹如故远远不够的。畴昔Pytorch-Wildlife将会畅达LILA:BC数据集,进一步晋升对物种识别的能力。

LILA数据集指的是亚历山大藏书楼的标注信息库:生物与保护(Labeled Information Library of Alexandria:Biology and Conservation),这是一个专注于生物学和野活泼物保衬限制的数据集库,提供了万般化的盛开数据资源,用于促进野活泼植物的监测、保护生物学究诘以及生态系统的经管。

LILA数据集包含多数经过标注的信息,比如图片、视频和其他类型的数据,这些数据有助于科学家和保护责任者诳骗机器学习和深度学习时刻来识别和追踪野活泼物,评估生物万般性。此外,通过使用LILA进行与测验,还卤莽监测生态系统的健康景色。

图:Pytorch-Wildlife畴昔的盘算图

数据猿也体验了一下Megadetector的实力。识别模子遴荐Megadetector v5,检测模子遴荐的是亚马逊森林。不错澄莹看出,只若是亚马逊森林中出现的动物,Megadetector皆能很好的识别出来。

图:亚马逊森林中的豹子

不外像是数据猿LOGO这种卡通动物形象,即便把识别阈值拉满,Megadetector也莫得主观点别出来。违抗,如果是真是的动物,Megadetector只需要很低的阈值就能识别。

图:Megadetector无法识别卡通动物形象

把柄开发团队的先容,Megadetector的最新版块,也就是Megadetector v6行将上线,识别率远超v5版块,同期铺张的计算资源更低。现在,使用Megadetector v5检测一张图片耗时约为20秒,而v6版块将会让耗时小于15秒。

另外Megadetector v6还会搭救更多的低预算开采,这是因为在亚马逊森林等地,温昂扬湿的生态环境会使得拍摄开采损坏率晋升,没主见永久保管资本腾贵的拍摄开采。然而资本较低的拍摄开采会导致拍摄画面的分辨率低下,帧数低下第等,对Megadetector的识别功课起到相等负面的影响。

在畴昔,Pytorch-Wildlife会搭救更多种类的识别形貌,比如鸟瞰图、水下拍摄。这何尝不是一种新的云衍生野活泼物的规范?

Pytorch-Wildlife属于典型的AI For Good花式,这个宗旨由微软建议,不外与其说是宗旨,更像是一种倡议。它是指在鼓动东说念主工智能时刻的发展与应用,以贬责大家道的社会、环境和经济挑战,促进可抓续发展。这一理念饱读吹科研东说念主员、企业、政府、非政府组织以及社会各界互助,诳骗东说念主工智能的力量创造正面影响,确保时刻朝上惠及全东说念主类和地球生态。

不一定非得是动物,其他同样的形貌皆不错算是AI For Good。举例,通过机器学习算法监测森林砍伐、海洋羞耻、欣忭变化和生物万般性减少,以及开发智能系统优化资源诳骗和动力经管。

事实上,Pytorch-Wildlife的中枢,Megadetector,简直莫得主见复刻任何的买卖阶梯。但这个花式依然领有弥散高的眷注度,诠释东说念主们眷注AI,使用AI时刻,眼里并不是只好它的买卖化能力,而是如何去使用AI,来开采赖以生涯的家园。天然了,也有一部分东说念主是冲着这个花式不错免费看信得过的野活泼物去的。

国内也有不少AI公司入部下手于同样的花式,比如百度的“绿色伙伙盘算”,通过AI来减少碳排放。把柄记载,百度舆图“低碳盘算”全年累计访谒量超越 4000 万东说念主次,累计可减少碳排放量超 3800 吨。

还有腾讯的“天然风险评估”,应用AI调优时刻,腾讯2023年畴昔减少用电量约5000兆瓦时,幸免碳排放2851.5吨。



Powered by 黔西南漳稳工程有限公司 @2013-2022 RSS地图 HTML地图

Copyright 站群 © 2013-2022 本站首页 版权所有