对企业的未来成功至关重要吗？

发布时间：2021-02-09 12:40:10 所属栏目：动态来源：互联网

导读：Inceptionv3 (GoogLeNet) Inceptionv3是一个深度为50层的卷积神经网络。它是由谷歌构建和训练的，你可以查看这篇论文：Going deep with convolutions。预训练好的带有ImageNet权重的Inceptionv3可以分类多达1000个对象。该网络的图像输入大小为299x299像素，

Inceptionv3 (GoogLeNet)

Inceptionv3是一个深度为50层的卷积神经网络。它是由谷歌构建和训练的，你可以查看这篇论文：“Going deep with convolutions”。预训练好的带有ImageNet权重的Inceptionv3可以分类多达1000个对象。该网络的图像输入大小为299x299像素，大于VGG19网络。VGG19是2014年ImageNet竞赛的亚军，而Inception是冠军。以下是对Inceptionv3特性的简要总结：

尺寸：92 MB
Top-1 准确率：77.9%
Top-5 准确率：93.7%
参数数量：23,851,784
深度：159

迁移学习是如何工作的？

实现迁移学习有三个要求：

由第三方开发开源预训练模型
重用模型
对问题进行微调

开发开源预训练模型

预训练的模型是由其他人创建和训练来解决与我们类似的问题的模型。在实践中，几乎总是有人是科技巨头或一群明星研究人员。他们通常选择一个非常大的数据集作为他们的基础数据集，比如ImageNet或Wikipedia Corpus。然后，他们创建一个大型神经网络(例如，VGG19有143,667,240个参数)来解决一个特定的问题(例如，这个问题用VGG19做图像分类。)当然，这个预先训练过的模型必须公开，这样我们就可以利用这些模型并重新使用它们。

重用模型

在我们掌握了这些预先训练好的模型之后，我们重新定位学习到的知识，包括层、特征、权重和偏差。有几种方法可以将预先训练好的模型加载到我们的环境中。最后，它只是一个包含相关信息的文件/文件夹。然而，深度学习库已经托管了许多这些预先训练过的模型，这使得它们更容易访问：

TensorFlow Hub
Keras Applications
PyTorch Hub

你可以使用上面的一个源来加载经过训练的模型。它通常会有所有的层和权重，你可以根据你的意愿调整网络。

对问题进行微调

现在的模型也许能解决我们的问题。对预先训练好的模型进行微调通常更好，原因有两个：

这样我们可以达到更高的精度。
我们的微调模型可以产生正确的格式的输出。

一般来说，在神经网络中，底层和中层通常代表一般的特征，而顶层则代表特定问题的特征。由于我们的新问题与原来的问题不同，我们倾向于删除顶层。通过为我们的问题添加特定的层，我们可以达到更高的精度。

在删除顶层之后，我们需要放置自己的层，这样我们就可以得到我们想要的输出。例如，使用ImageNet训练的模型可以分类多达1000个对象。如果我们试图对手写数字进行分类(例如，MNIST classification)，那么最后得到一个只有10个神经元的层可能会更好。

在我们将自定义层添加到预先训练好的模型之后，我们可以用特殊的损失函数和优化器来配置它，并通过额外的训练进行微调。

计算机视觉中的4个预训练模型

这里有四个预先训练好的网络，可以用于计算机视觉任务，如图像生成、神经风格转换、图像分类、图像描述、异常检测等：

VGG19
Inceptionv3 (GoogLeNet)
ResNet50
EfficientNet

让我们一个一个地深入研究。

VGG-19

VGG是一种卷积神经网络，深度为19层。它是由牛津大学的Karen Simonyan和Andrew Zisserman在2014年构建和训练的，论文为：Very Deep Convolutional Networks for large Image Recognition。VGG-19网络还使用ImageNet数据库中的100多万张图像进行训练。当然，你可以使用ImageNet训练过的权重导入模型。这个预先训练过的网络可以分类多达1000个物体。对224x224像素的彩色图像进行网络训练。以下是关于其大小和性能的简要信息：

大小：549 MB
Top-1 准确率：71.3%
Top-5 准确率：90.0%
参数个数：143,667,240
深度：26

（编辑：漯河站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!