通知公告 - 智能信息处理中心

2025年01月03日：ChatTime：A Unified Multimodal Time Series Foundation Model Bridging Numerical and Textual Data

主页 /
通知公告 /
通知公告

2025年01月03日：ChatTime：A Unified Multimodal Time Series Foundation Model Bridging Numerical and Textual Data

【报告内容】

汇报人：陈昱璠

汇报单位：福建理工大学

主题：《ChatTime：A Unified Multimodal Time Series Foundation Model Bridging Numerical and Textual Data》

1、Introduction

2、Method

3、Experiments

4、Conclusion

【报告总结】

1、待解决的问题描述

1）传统深度学习预测器多依赖单模态数值数据，使用固定长度窗口在单一数据集上训练和预测，无法适应不同场景。

2）现有基于预训练大语言模型（LLM）的时间序列分析方法，其一训练效率低，其二无法处理文本信息，其三缺乏零样本预测能力。

3）现有方法在处理时间序列问答和总结等场景时，因无法输出文本而受限。

2、相关创新方案

1）模型构建：将时间序列概念转化为一门外语，构建了ChatTime这一统一框架，实现时间序列和文本的统一处理。它是一个开箱即用的多模态时间序列基础模型，支持零样本推理以及时间序列和文本的双模态输入/输出。

2）数据处理：通过归一化和离散化将连续无界的时间序列转换为有限离散值，添加标记字符将其表征为外语单词，扩展了Tokenizer词汇，使每个值仅需一个token。

3）训练过程：分为连续预训练和指令微调两个阶段。连续预训练使用1M高质量时间序列切片对LLaMA-2-7B-Base进行预训练得到ChatTime-1-7B-Base；指令微调使用四个任务数据集对ChatTime-1-7B-Base进行微调得到ChatTime-1-7B-Chat。

3、实验总结

1）零样本时间序列预测（ZSTSF）：在八个基准数据集上进行实验，ChatTime仅使用4%的数据就达到了之前SOTA方法Chronos零样本预测准确率的99.9%，与全样本预测模型相比，也达到了之前SOTA方法GPT4TS预测准确率的90.9%，验证了单模态方法可能接近饱和点。

2）上下文引导的时间序列预测（CGTSF）：在三个数据集上实验，结果表明结合文本信息后，ChatTime表现优于其他Baseline模型，且优于仅使用单模态值的ChatTime -，证明了上下文辅助的有效性。

3）时间序列问答（TSQA）：在合成数据集上实验，ChatTime在理解时间序列特征方面表现优于通用预训练LLMs，证明了其在时间序列理解方面的优越性。

4）消融实验：验证了自回归连续预训练、时间序列切片聚类以及微调指令中的文本问答任务对ChatTime的重要性，去除这些部分会导致模型性能下降。

4、未来工作

1）扩展适用任务：因资源限制，ChatTime尚未达到性能饱和。未来计划使用更多数据和计算资源，将其适用任务拓展至异常检测、分类或总结等领域。

2）模型优化与性能提升：投入更多数据和计算资源，进一步提升模型性能，让模型在现有任务上表现更优，对时间序列和文本的处理更加精准高效；深入探索改进ChatTime的模型架构设计，优化连续预训练和指令微调过程，提高模型训练的稳定性和收敛速度，减少训练时间和资源消耗，同时提升模型的泛化能力，使其能更好地适应不同类型和规模的数据集。

报告时间：2025年01月03日19:30

腾讯会议：311-5999-8176

点我下载本讨论课相关文献或PPT吧~(提取码：iipr)