pg下载官方认证 解锁图像识别:卷积神经网络的奇妙之旅
图像识别,乃是计算机“看懂”图片的技术,它归属于计算机视觉的核心能力范畴。如今,其早就深入融入我们的生活之中。安防摄像头抓拍到陌生人时会发出报警信号,自动驾驶能够“看见”行人,在医院里医生借助它辅助判断 CT 片里的病灶。而能够让计算机具备这种“视力”的关键技术呢,便是卷积神经网络pg下载渠道,我们把它简称为 CNN。与早期的 BP 神经网络相比较,CNN 格外擅长处理图片数据,成功地解决了处理图片时所面临的“数据太多算不过来”的重大难题。

图像识别及卷积神经网络
要晓得 CNN 为何厉害,就得先清楚图片在计算机眼中是何种模样的。实际上每一张图片皆是由数量众多的“像素点”所构成的方格本,每个点的亮度借由 0 到 255 的数字予以表示。比如说一张平常的黑白照片,便存在将近 80 万个这样的数字;倘若为彩色照片,还需划分成红、绿、蓝三个通道,数字量会直接增长三倍。要是运用早期的 BP 神经网络来处理,就得具备几十万个“计算节点”,不仅电脑运算得迟缓,还易于出现差错。

位于计算机里的图片,其像素所组成与构建的形式,以及关于CNN和BP神经网络两者之间相互对照比较的情况 。
而CNN所具“观图片”之逻辑与人类大脑极为相似,当我们瞅见一条狗之际,初始会留意到其耳部、鼻部等这般细微之特征,随后将这些特征予以拼凑进而判定为狗,CNN亦是如此行径,借由多层“过滤器”逐次提取各项特征,从诸如边缘、斑点这般简易之特征,缓缓演变成“耳朵”、“尾巴”这般复杂之特征,最终便可断定图片之中究竟为何物,。

CNN 与人脑视觉原理相似呈现逐层提取的特征
依靠内部四层结构的默契配合,CNN才能够“看懂”图片,我们可将它们想象成一条“图片处理流水线”。第一层称作“特征提取层”(卷积层),如同给图片戴上一副特殊的“眼镜”,这副“眼镜”是个3×3的小方格(名为卷积核),它会于图片上缓缓滑动,每滑至一个位置便做一次计算,最终生成一张“特征图”——恰似我们借助放大镜在图片上寻觅边缘、斑点。“眼镜”的数量、滑动的步长等设置,会对找到的特征效果产生影响。 .

卷积神经网络的卷积层
第二层是所谓的“筛选层”,也就是大家常说的“激活层”pg下载赏金下载,它具备着一种特殊的作用,那就是“去伪存真”,能够将那些没有实际用处的特征给过滤掉,进而使得那些具有实际价值的特征更为突出,同时它还拥有另外一个强大功能,就是可以避免在计算过程里常常出现的,那种“越算越不准”的棘手问题,而在常用的筛选工具范畴之内,有一种叫做ReLU的,它就如同是一位极其严格的质检员一般 。

卷积神经网络的激活层
存在一个第三层,它被称作“压缩层”,也就是池化层,它能够依照一定比例去缩小特征图,举例来说,会把呈现为4×4的方格状的特征图,缩小成为2×2的,如此一来,既能够削减计算量,又能够留存关键特征pg下载通道,比如采用“取最大值”这种方式进行压缩,能够更优地留存纹理,而采用“取平均值”这种方式去压缩,便能够更优地留存背景 。

卷积神经网络的池化层
处在最后的那一层是称为“判断层”的全连接层,它会将先前提取的全部特征进行汇总,依靠计算给出像“这是猫的概率为90%,是狗的概率为10%”这般的结果,承担着最终拍板判断的职责。

卷积神经网络的全连接层
CNN并非从一开始就具备看图片的能力,而是需要经历“训练”这一过程才能达成,该过程类似教导小孩认识事物,大致可划分成四个步骤:第一步是“初始化”,仿若为孩子准备一套空白的“知识卡片”,率先随机书写一些初始答案。第二步是“反复练习”,将大量已标注好的图片 (诸如标有“猫”“狗”的图片) 分批次提供给CNN,并让它先自行进行判断 (前向传播),随后依据判断的对错来调整“知识卡片” (反向传播)——比方说把“猫”错认成“狗”了,那就查看是哪一个特征判断失误了,进而重新予以修改。第三步称作“优化调整”,运用专门相应方法,迅速去修正错误之处,以使每次练习都能够存有进步。第四步名为“考试验收”,借助未曾见过的图片,测试CNN的判断准确比率,以此查看训练效果究竟好不好。

卷积神经网络的训练过程
历经多年发展,CNN已然具备了好几代“经典版本”,最早的LeNet恰似CNN的“老祖宗”,其擅长识别手写数字,为后续的发展奠定了基础,然而它较为简单,处理复杂图片的能力有所欠缺,AlexNet属于“升级款”,它加深了网络层数,并且运用了ReLU这个“好工具”,从而使得CNN得以普及,但它特别耗费电脑算力,VGG Net借助统一的“特征提取眼镜”增强了识别能力,分类十分准确,可惜所需的“知识卡片”过多,存在一定程度的冗余。Google Net,发明了“多镜头”模块,此模块能够同时提取不同大小的特征,该模块减少了计算量,然而此模块结构太复杂。最新的ResNet,解决了“网络太深学不会”的难题,其能干搭建更复杂的网络,如今很多视觉任务都在使用它。

卷积神经网络的发展历程
这些不同版本的CNN,在生活中发挥着不同作用。像“图像分类”这般的情况,乃是为图片贴上标签之举,举例来说,手机相册会自动将照片划分成“人物”“风景”等类别,医院借助它来初步判定CT片是否存在病变状况 ; “目标检测”这一行为,不但要识别出所为何物,而且还要标明其所在位置,比如在自动驾驶过程中能够标记出前方的行人、车辆,工厂运用它来检查产品是否存有缺陷 ; “语义分割”更为精细入微,它能够针对图片里面的每个像素进行“分类”操作,比如在遥感卫星图里区分出农田、道路以及建筑,在医院里精确地圈定出肿瘤的位置 ; “风格迁移”则极具趣味性,它能够把普通照片转变为梵高油画的风格样式,从而为艺术创作以及图片编辑给予便利条件 。

卷积神经网络的应用
一般而言,卷积神经网络使计算机切实“看懂”了图片,将处理海量图片数据的难题全然解决。依据电脑算力不断增强,算法持续优化的状况来看,往后CNN会于更多场景施展作用,像更精确的医疗诊断、更具安全性的自动驾驶、更智能化的安防系统等,持续为我们的生活以及工作带来全新变化。