神经网络基础:感知器
神经网络是一种受人脑启发而开发的机器学习模型。神经网络无需显式编程,即可通过学习示例来执行任务。这些任务多种多样,例如基于历史数据预测销售额、检测图像中的物体、语言翻译等等。
感知器
感知器是神经网络的结构组成单元,它的设计灵感来源于大脑中的神经元。
从数学角度来看,这可以用以下等式表示:
我们可以用以下方式解释单个感知器的工作原理:
- 每个感知器接收一组输入 x 1到 x m。
- 每个输入都有一个与之相关的权重,即 w 1到 w m分别对应 x 1到 x m。
- 每个输入与其各自的权重相乘,相加,然后作为输入传递给激活函数。
- 此外,还添加了一个偏置项 w 0,这使我们能够将激活函数向左或向右移动,而与输入无关。
- 激活函数,也称为非线性函数,是一种产生感知器最终输出的非线性函数。
激活函数
激活函数是一种非线性函数。一些常见的激活函数包括 sigmoid 函数、双曲正切 (tanh) 函数和修正线性单元 (ReLU) 函数。激活函数的选择取决于感知器预期输出的类型。例如,sigmoid 函数的输出值介于 0 和 1 之间。因此,当输出需要表示概率时,sigmoid 函数非常适用。
为什么我们需要激活函数
激活函数为网络引入非线性。在现实生活中,几乎所有数据都是非线性的。如果没有激活函数,输出将始终是线性的。而非线性则允许我们逼近任意复杂的函数。
结论
在这篇文章中,我们学习了单个感知器的工作原理。在下一篇文章中,我们将了解这些感知器是如何连接起来形成神经网络的,以及神经网络如何学习执行它最初并未被明确编程执行的任务。
我很想听听你们的意见和反馈。欢迎随时在推特上联系我。
文章来源:https://dev.to/_akshaym/neural-network-basics-the-perceptron-3c4



