当前位置：首页 >> 编程语言 >> 【PyTorch】多项式回归,德拉吉

【PyTorch】多项式回归,德拉吉

0evadmin 2025-12-10 15:36:02 编程语言 2

文件名：【PyTorch】多项式回归,德拉吉【PyTorch】多项式回归

文章目录 1. 模型与代码实现1.1. 模型1.2. 代码实现1.2.1. 完整代码1.2.2. 输出结果 2. Q&A2.1. 欠拟合与过拟合

1. 模型与代码实现 1.1. 模型将多项式特征值预处理为线性模型的特征值。即

w_0+w_1x+w_2x^2+\dots+w_nx^n

变换为

y=w_0+w_1z_1+w_2z_2+\dots+w_nz_n

为了避免指数值过大，可以将

x^i

调整为

\frac{x^i}{i!}

，即

w_0+w_1\frac{x}{1!}+w_2\frac{x^2}{2!}+\dots+w_n\frac{x^n}{n!}

1.2. 代码实现 1.2.1. 完整代码 import osimport numpy as npimport math, torchfrom d2l import torch as d2limport torch.nn as nnfrom torch.utils.data import DataLoader, TensorDatasetfrom tensorboardX import SummaryWriterfrom rich.progress import trackdef evaluate_loss(dataloader):"""评估给定数据集上模型的损失"""metric.reset()with torch.no_grad():for X, y in dataloader:X, y = X.to(device, non_blocking=True), y.to(device, non_blocking=True)loss = criterion(net(X), y)metric.add(loss.sum(), loss.numel())return metric[0] / metric[1]def load_dataset(data_arrays):"""加载数据集"""dataset = TensorDataset(*data_arrays)return DataLoader(dataset, batch_size, shuffle=True, pin_memory=True,num_workers=num_workers, prefetch_factor=prefetch_factor)if __name__ == '__main__':# 全局参数设置learning_rate = 0.01device = torch.device("cuda" if torch.cuda.is_available() else "cpu")num_epochs = 400batch_size = 10num_workers = 0prefetch_factor = 2max_degree = 20 # 多项式最高阶数model_degree = 1 # 多项式模型阶数n_train, n_test = 100, 100 # 训练集和测试集大小true_w = np.zeros(max_degree+1)true_w[0:4] = np.array([5, 1.2, -3.4, 5.6])# 创建记录器def get_logdir():root = 'runs'if not os.path.exists(root):os.mkdir(root)order = len(os.listdir(root)) + 1return f'runs/exp{order}'writer = SummaryWriter(get_logdir())# 生成数据集features = np.random.normal(size=(n_train + n_test, 1))np.random.shuffle(features)poly_features = np.power(features, np.arange(max_degree+1).reshape(1, -1))for i in range(max_degree+1):poly_features[:, i] /= math.gamma(i + 1) # gamma(n)=(n-1)!labels = np.dot(poly_features, true_w)labels += np.random.normal(scale=0.1, size=labels.shape) # 加高斯噪声服从N(0, 0.01)poly_features, labels = [torch.as_tensor(x, dtype=torch.float32) for x in [poly_features, labels]]# 创建模型net = nn.Sequential(nn.Linear(model_degree+1, 1, bias=False)).to(device, non_blocking=True)def init_weights(m):if type(m) == nn.Linear:nn.init.normal_(m.weight, mean=0, std=0.01)net.apply(init_weights)criterion = nn.MSELoss(reduction='none')optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate)# 加载数据集features_train, labels_train = poly_features[:n_train, :model_degree+1], labels[:n_train].reshape(-1, 1)features_test, labels_test = poly_features[n_train:, :model_degree+1], labels[n_train:].reshape(-1, 1)dataloader_train = load_dataset((features_train, labels_train))dataloader_test = load_dataset((features_test, labels_test))# 训练循环metric = d2l.Accumulator(2) # 损失的总和, 样本数量for epoch in track(range(num_epochs)):for X, y in dataloader_train:X, y = X.to(device, non_blocking=True), y.to(device, non_blocking=True)loss = criterion(net(X), y)optimizer.zero_grad()loss.mean().backward()optimizer.step()writer.add_scalars(f"{model_degree}-degree", {"train_loss": evaluate_loss(dataloader_train),"test_loss": evaluate_loss(dataloader_test),}, epoch)print("weights =", net[0].weight.data.cpu().numpy())writer.close() 1.2.2. 输出结果

采用1阶多项式（线性模型）拟合：

采用3阶多项式拟合

采用20阶多项式拟合

2. Q&A 2.1. 欠拟合与过拟合

数据集是按照3阶多项式生成的。使用1阶多项式去拟合，发现最后损失始终降不下去，这种情况称为欠拟合，说明模型复杂度不够；使用20阶多项式去拟合，发现测试损失最后还增长了，训练和测试损失总体也比3阶多项式模型的值高，这种情况称为过拟合，说明模型太复杂了，训练过程受到了噪声的影响。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

【PyTorch】多项式回归,德拉吉

【PyTorch】多层感知机,爱普泰克

【PyTorch】数据集,小米2手机

【PYTHON】WebSocket服务端与客户端通信实现,天逸f40（python websocket服务器端）

【PyCharm Community Edition】：分析map文件统计RAM及ROM的使用,a豆

【PyQt】(自定义类)阴影遮罩-升级版,gb浏览器（pyqt隐藏按钮）

【PyQt学习篇 · ⑨】：QWidget -控件交互,朗琴x300

【PyQt学习篇 · ⑪】：QPushButton和QCommandLinkButton的使用,声卡报价

【PyQt小知识 - 2】：QTextEdit内容的更新和获取、隐藏或显示滚动条、光标插入文本、文本自适应移动,libfetion

【PyQt小知识 - 3】： QComboBox下拉框内容的设置和更新、默认值的设置、值和下标的获取,佳能eos 550d

【PyTorch 卷积】实战自定义的图片归类,步步高vivo手机

【PyTorch】PyTorch、Cuda 的安装和使用,hd高清