【TensorFlow-windows】部分损失函数测试,长虹h5018_技术栈专业化分层

文件名：【TensorFlow-windows】部分损失函数测试,长虹h5018 【TensorFlow-windows】部分损失函数测试前言

在TensorFlow中提供了挺多损失函数的，这里主要测试一下均方差与交叉熵相关的几个函数的计算流程。主要是测试来自于tf.nn与tf.losses的mean_square_error、sigmoid_cross_entry、softmax_cross_entry、sparse_softmax_cross_entry

国际惯例，参考博客：

官方文档

一文搞懂交叉熵在机器学习中的使用，透彻理解交叉熵背后的直觉

TensorFlow中多标签分类

预备单热度编码one-hot

先复习一下one_hot编码，就是将真实标签转换为01标签，需要注意的是tf的one_hot编码中标签0代表的是1,0,0...而非0,0,0...

labels_n=np.array([0,1,2])labels_oh=tf.one_hot(labels_n,depth=3)with tf.Session() as sess:print(sess.run(labels_oh))'''[[1. 0. 0.][0. 1. 0.][0. 0. 1.]]''' softmax

通常将最后的输出规整到和为1的形式：

softmax = tf.exp(logits) / tf.reduce_sum(tf.exp(logits), axis)

设输出为 $z=(z1,z2,⋯ ,zn)z=(z_1,z_2,\cdots,z_n)$ ，则 $σ(z)j=ezj∑i=1nezk\sigma(z)_j=\frac{e^{z_j}}{\sum_{i=1}^n e^{z_k}}$

sigmoid

激活函数： $f(x)=11+e−xf(x)=\frac{1}{1+e^{-x}}$

交叉熵

多标签分类(每个样本可能属于多个标签)，最后一层使用sigmoid激活：

$−ylog⁡(P(y))−(1−y)log⁡(1−P(y))-y\log(P(y))-(1-y)\log(1-P(y))$

单标签分类(每个样本只可能属于一个标签)，最后一层使用softmax激活： $−∑i=1nyilog⁡(P(yi))-\sum_{i=1}^n y_i\log(P(y_i))$

准备测试

进入测试之前，需要先引入相关的包

import numpy as npimport tensorflow as tf

交叉熵相关函数的测试，使用的变量是

labels=np.array([[1,0,0],[0,1,0],[0,0,1]],dtype='float32')preds=np.array([[5,6,3],[7,5,1],[1,2,8]],dtype='float32') 均方差损失-MSE 原理

对应项相减的平方和的均值，通常用来做回归，计算预测值与真实值的误差

代码测试

定义相关变量：

ori_labels=np.array([[1,2,3]],dtype='float32')pred_labels=np.array([[5,3,3]],dtype='float32')

调用原本函数测试：

mse_op=tf.losses.mean_squared_error(labels=ori_labels,predictions=pred_labels)with tf.Session() as sess:print(sess.run(mse_op))'''5.6666665'''

手动实现过程：

with tf.Session() as sess:print(sess.run(tf.reduce_mean(tf.square(ori_labels-pred_labels))))'''5.6666665''' 总结

原理就是求原标签与预测标签的平方和损失的均值。

sigmoid_cross_entry 原理

使用sigmoid激活的交叉熵，毫无疑问，玩得多标签分类，流程是：

将输出用sigmoid激活使用多标签分类的交叉熵计算损失代码测试

使用tf.losses中的交叉熵损失

tf_sce=tf.losses.sigmoid_cross_entropy(labels,preds)with tf.Session() as sess:print(sess.run(tf_sce))#2.3132434

使用tf.nn中的交叉熵损失：

tf_sce1=tf.nn.sigmoid_cross_entropy_with_logits(labels=labels,logits=preds)with tf.Session() as sess:print(sess.run(tf_sce1))'''[[6.7153485e-03 6.0024757e+00 3.0485873e+00][7.0009112e+00 6.7153485e-03 1.3132617e+00][1.3132617e+00 2.1269281e+00 3.3540637e-04]]'''

使用流程实现：

#先计算sigmoid，再计算交叉熵preds_sigmoid=tf.sigmoid(preds)ce=-labels*tf.log(preds_sigmoid)-(1-labels)*(tf.log(1-preds_sigmoid))# ce= - tf.reduce_sum(labels*tf.log(preds_sigmoid),-1)with tf.Session() as sess:print(sess.run(ce))print(sess.run(tf.reduce_mean(ce)))'''[[6.7153242e-03 6.0024934e+00 3.0485876e+00][7.0009704e+00 6.7153242e-03 1.3132617e+00][1.3132617e+00 2.1269276e+00 3.3539196e-04]]2.3132522''' 总结

多标签分类，输入是原始和预测标签的编码

tf.losses中的计算结果是tf.nn中计算结果的均值

softmax_cross_entry 原理

使用softmax激活，显然就是单标签分类的情况，流程是：

将输出用softmax激活计算单标签分类的交叉熵损失代码测试

使用tf.losses中的函数:

tf_sce=tf.losses.softmax_cross_entropy(labels,preds)with tf.Session() as sess:print(sess.run(tf_sce))#1.160502

使用tf.nn中的函数：

tf_sce1=tf.nn.softmax_cross_entropy_with_logits(labels=labels,logits=preds)with tf.Session() as sess:print(sess.run(tf_sce1))#[1.3490121 2.129109 0.00338493]

使用流程计算：

#先计算softmax，再计算交叉熵preds_sigmoid=tf.nn.softmax(preds)ce= - tf.reduce_sum(labels*tf.log(preds_sigmoid),-1)# ce=-labels*tf.log(preds_sigmoid)-(1-labels)*(tf.log(1-preds_sigmoid))with tf.Session() as sess:print(sess.run(ce))print(sess.run(tf.reduce_mean(ce)))'''[1.3490121 2.129109 0.00338495]1.1605021''' 总结用于单标签分类，输入是真实和预测标签的单热度编码tf.losses中的计算结果是tf.nn中计算结果的均值 sparse_softmax_cross_entry 原理

还是看到softmax，依旧是单标签分类，但是多了个sparse，代表输入标签可以是非单热度标签，流程：

将原标签转为单热度编码将输出用softmax激活计算单标签分类的交叉熵代码测试

假设原始标签的非单热度编码是：

labels_n=np.array([0,1,2])

利用tf.losses中的损失函数：

tf_scen=tf.losses.sparse_softmax_cross_entropy(labels=labels_n,logits=preds)with tf.Session() as sess:print(sess.run(tf_sce))#1.160502

利用tf.nn中的损失函数：

tf_sce1=tf.nn.sparse_softmax_cross_entropy_with_logits(labels=labels_n,logits=preds)with tf.Session() as sess:print(sess.run(tf_sce1))print(sess.run(tf.reduce_mean(tf_sce1)))'''[1.3490121 2.129109 0.00338493]1.160502'''

利用流程实现：

labels_onehot=tf.one_hot(labels_n,depth=3)preds_sigmoid=tf.nn.softmax(preds)ce= - tf.reduce_sum(labels_onehot*tf.log(preds_sigmoid),-1)# ce=-labels*tf.log(preds_sigmoid)-(1-labels)*(tf.log(1-preds_sigmoid))with tf.Session() as sess:print(sess.run(labels_onehot))print(sess.run(ce))print(sess.run(tf.reduce_mean(ce))) '''[[1. 0. 0.][0. 1. 0.][0. 0. 1.]][1.3490121 2.129109 0.00338495]1.1605021''' 总结有sparse代表原始标签不用转成单热度编码适用于单标签分类tf.losses是tf.nn中函数的均值总结

本文主要对比了：

tf.nn、tf.losses中同一类损失函数的使用方法与区别分析计算流程，并实现验证了解TensorFlow中回归、单标签分类、多标签分类的损失函数的选择

博客代码：

链接：https://pan.baidu.com/s/1b40rNxjdOIIE2g7_Afctiw 提取码：0sb0

【TensorFlow-windows】部分损失函数测试,长虹h5018

2018年5月北京电力交易中心市场化交易规模203亿千瓦时

2018年5月集中竞价交易简报

【PTA题目】7-12 N个数求和分数 20,三星p1010

【QGIS入门实战精品教程】4.2：QGIS矢量数据采集（地图数字化）案例教程,诺基亚6600s

【Qt】字体更大的富文本,滴滴卖国（滴滴字体）

【Qt之QMapIterator】检测是否为空,猪肉夜里泛出蓝光

【Qt之QSplashScreen】开场动画使用-进度条加载及设置鼠标指针不转圈,麦博雅皮士h20

【Qt开发流程】之文件目录、文件、输入和输出,昂达v812（qt打开文件目录）

【R Error系列】r - fatal error - RcppEigen. h-没有这样的文件或目录,黛芙薇尔让我祛斑成功

【RK3399Pro学习笔记】八、ROS话题消息的定义与使用,半条命2第一章

【RabbitMQ】RabbitMQ详解(二),推荐几个安全没封的网站2021

« 2026年1月 »
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31