【Python时序预测系列】一文搞明白时序数据输入到LSTM模型的格式
ztj100 2024-11-08 15:06 15 浏览 0 评论
这是我的第276篇原创文章。
一、引言
前面我介绍了多个方法实现单变量和多变量时序数据的单站点单步预测,好多小伙伴最近问我这个LSTM模型数据的输入的格式是怎么样的,今天我专门写一篇文章来聊一聊这个问题,希望对大家有所启发和帮助。
二、实现过程
2.1 单变量时序数据
1、原始data
原始数据是一个144行1列的(144,1)的dataframe:
2、数据集按照8:2划分,并进行归一化处理
train_data_scaler是一个(115,1)的二维数组:
3、创建滑动窗口数据集
将train_data_scaler集转换为 LSTM 模型所需的形状(样本数,时间步长,特征数):
def create_sliding_windows(data, window_size):
X, Y = [], []
for i in range(len(data) - window_size):
X.append(data[i:i+window_size, 0:data.shape[1]])
Y.append(data[i+window_size,0])
return np.array(X), np.array(Y)
X_train, Y_train = create_sliding_windows(train_data_scaler, window_size)
这里我假设窗口window_size设为12,i的范围0-102,103取不到:
当i=0时,取出train_data_scaler第【1-12】行第【1】列的12条数据作为X_train[0],取出train_data_scaler第【13】行第【1】列的1条数据作为Y_train[0];
当i=1时,取出train_data_scaler第【2-13】行第【1】列的12条数据作为X_train[1],取出train_data_scaler第【14】行第【1】列的1条数据作为Y_train[1];
...
当i=102时,取出train_data_scaler第【103-114】行第【1】列的12条数据作为X_train[102],取出train_data_scaler第【115】行第【1】列的1条数据作为Y_train[102];
返回的X_train是一个(103,12,1)的三维数组;Y_train是一个(103,1)的二维数组;
X_train = np.reshape(X_train, (X_train.shape[0], window_size, 1)
经过滑动窗口之后返回的形状已经是LSTM所需的形状了,所以这句话可以省略。
4、构建 LSTM 模型
# 构建 LSTM 模型
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(window_size, 1)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')
LSTM的input_shape=(时间步长,特征数),其实就是一个样本输入的形状。
5、训练 LSTM 模型
# 训练 LSTM 模型
model.fit(X_train, Y_train, epochs=100, batch_size=32)
- X_train是一个(103,12,1)的三维数组,三个维度分别表示(样本数,时间步长,特征数)
- Y_train是一个(103,1)的二维数组,两个维度分别表示(样本数,标签)
- 类似一个103行(12*1+1)列的表格,前(12*1)列是特征,第(12*1+1)列是标签
2.2 多变量时序数据
1、原始的data
是一个(5203,5)的dataframe:
2、数据集按照8:2划分,并进行归一化处理
train_data_scaler是一个(4162,5)的二维数组:
3、创建滑动窗口数据集
将数据集转换为 LSTM 模型所需的形状(样本数,时间步长,特征数):
def create_sliding_windows(data, window_size):
X, Y = [], []
for i in range(len(data) - window_size):
X.append(data[i:i+window_size, 0:data.shape[1]])
Y.append(data[i+window_size,0])
return np.array(X), np.array(Y)
X_train, Y_train = create_sliding_windows(train_data_scaler, window_size)
这里我假设窗口window_size设为30,i的范围0-4131:
当i=0时,取出train_data_scaler第【1-30】行第【1-5】列的12条数据作为X_train[0],取出train_data_scaler第【31】行第【1】列的1条数据作为Y_train[0];
当i=1时,取出train_data_scaler第【2-31】行第【1-5】列的12条数据作为X_train[1],取出train_data_scaler第【32】行第【1】列的1条数据作为Y_train[1];
...
当i=4131时,取出train_data_scaler第【4132-4161】行第【1-5】列的12条数据作为X_train[4131],取出train_data_scaler第【4162】行第【1】列的1条数据作为Y_train[4131];
返回的X_train是一个(4132,30,5)的三维数组;Y_train是一个(4132,1)的二维数组;
X_train = np.reshape(X_train, (X_train.shape[0], window_size, 5)
经过滑动窗口之后返回的形状已经是LSTM所需的形状了,所以这句话可以省略。
4、构建 LSTM 模型
# 构建 LSTM 模型
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(window_size, 5)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')
LSTM的input_shape=(时间步长,特征数),其实就是一个样本输入的形状。
5、训练 LSTM 模型
# 训练 LSTM 模型
model.fit(X_train, Y_train, epochs=100, batch_size=32)
- X_train是一个(4132,30,5)的三维数组;(样本数,时间步长,特征数)
- Y_train是一个(4132,1)的二维数组;(样本数,标签)
- 类似一个4132行(30*5+1)列的表格,前(30*5)列是特征,第(30*5+1)列是标签
三、小结
由于滑动窗口,实际的训练数据数量少一个窗口数量,实际能预测的数据量也少一个窗口数量。
作者简介: 读研期间发表6篇SCI数据算法相关论文,目前在某研究院从事数据算法相关研究工作,结合自身科研实践经历持续分享关于Python、数据分析、特征工程、机器学习、深度学习、人工智能系列基础知识与案例。关注gzh:数据杂坛,获取数据和源码学习更多内容。
原文链接:
相关推荐
- 从IDEA开始,迈进GO语言之门(idea got)
-
前言笔者在学习GO语言编程的时候,GO语言在国内还没有像JAVA/Php/Python那样普及,绕了不少的弯路,要开始入门学习一门编程语言,最好就先从选择一个好的编程语言的开发环境开始,有了这个开发环...
- 基于SpringBoot+MyBatis的私人影院java网上购票jsp源代码Mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍基于SpringBoot...
- 基于springboot的个人服装管理系统java网上商城jsp源代码mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍基于springboot...
- 基于springboot的美食网站Java食品销售jsp源代码Mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍基于springboot...
- 贸易管理进销存springboot云管货管账分析java jsp源代码mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目描述贸易管理进销存spring...
- SpringBoot+VUE员工信息管理系统Java人员管理jsp源代码Mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍SpringBoot+V...
- 目前见过最牛的一个SpringBoot商城项目(附源码)还有人没用过吗
-
帮粉丝找了一个基于SpringBoot的天猫商城项目,快速部署运行,所用技术:MySQL,Druid,Log4j2,Maven,Echarts,Bootstrap...免费给大家分享出来前台演示...
- SpringBoot+Mysql实现的手机商城附带源码演示导入视频
-
今天为大家带来的是基于SpringBoot+JPA+Thymeleaf框架的手机商城管理系统,商城系统分为前台和后台、前台用的是Bootstrap框架后台用的是SpringBoot+JPA都是现在主...
- 全网首发!马士兵内部共享—1658页《Java面试突击核心讲》
-
又是一年一度的“金九银十”秋招大热门,为助力广大程序员朋友“面试造火箭”,小编今天给大家分享的便是这份马士兵内部的面试神技——1658页《Java面试突击核心讲》!...
- SpringBoot数据库操作的应用(springboot与数据库交互)
-
1.JDBC+HikariDataSource...
- SpringBoot 整合 Flink 实时同步 MySQL
-
1、需求在Flink发布SpringBoot打包的jar包能够实时同步MySQL表,做到原表进行新增、修改、删除的时候目标表都能对应同步。...
- SpringBoot + Mybatis + Shiro + mysql + redis智能平台源码分享
-
后端技术栈基于SpringBoot+Mybatis+Shiro+mysql+redis构建的智慧云智能教育平台基于数据驱动视图的理念封装element-ui,即使没有vue的使...
- Springboot+Mysql舞蹈课程在线预约系统源码附带视频运行教程
-
今天发布的是由【猿来入此】的优秀学员独立做的一个基于springboot脚手架的Springboot+Mysql舞蹈课程在线预约系统,系统项目源代码在【猿来入此】获取!https://www.yuan...
- SpringBoot+Mysql在线众筹系统源码+讲解视频+开发文档(参考论文
-
今天发布的是由【猿来入此】的优秀学员独立做的一个基于springboot脚手架的在线众筹管理系统,主要实现了普通用户在线参与众筹基本操作流程的全部功能,系统分普通用户、超级管理员等角色,除基础脚手架外...
- Docker一键部署 SpringBoot 应用的方法,贼快贼好用
-
这两天发现个Gradle插件,支持一键打包、推送Docker镜像。今天我们来讲讲这个插件,希望对大家有所帮助!GradleDockerPlugin简介...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 从IDEA开始,迈进GO语言之门(idea got)
- 基于SpringBoot+MyBatis的私人影院java网上购票jsp源代码Mysql
- 基于springboot的个人服装管理系统java网上商城jsp源代码mysql
- 基于springboot的美食网站Java食品销售jsp源代码Mysql
- 贸易管理进销存springboot云管货管账分析java jsp源代码mysql
- SpringBoot+VUE员工信息管理系统Java人员管理jsp源代码Mysql
- 目前见过最牛的一个SpringBoot商城项目(附源码)还有人没用过吗
- SpringBoot+Mysql实现的手机商城附带源码演示导入视频
- 全网首发!马士兵内部共享—1658页《Java面试突击核心讲》
- SpringBoot数据库操作的应用(springboot与数据库交互)
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- node卸载 (33)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- exceptionininitializererror (33)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)