你好,我是 邱晓晨

数据科学与大数据技术 · 本科在读

积极 · 自信 · 沟通力强 | 热爱全栈开发与人工智能

关于我

邱晓晨 / 男 / 2005.3.9
现居:上海市
13345544905
13345544905@163.com
大学英语 CET4

自我评价

我是一名数据科学与大数据技术专业的学生,对 Web 全栈开发和人工智能有着浓厚的兴趣。具备扎实的编程基础与良好的面向对象编程思想,熟练掌握 Java、Python 等主流编程语言,熟悉 Spring Boot 后端框架和 Vue 前端框架。

在校期间积极参与项目开发和实践活动,主导过多个基于 AI 技术的实际应用项目,具备独立完成系统架构设计与核心模块开发的能力。熟练运用 Cursor、Claude Code 等 AI 编程工具,实践 Vibe Coding 开发模式,显著提升开发效率。

积极,自信,大胆,沟通力强。成熟稳重,责任心强,心态稳定,敢于担当重任;接受能力强,能迅速接受新的理论与技能。

教育背景

上海杉达学院

本科在读

数据科学与大数据技术 · 2023.09 ~ 至今

3.59/4.0
GPA
校二等奖学金
五四优秀团干
优秀团员

主修课程

程序设计基础 数据结构 计算机组成原理 计算机网络 概率论与数理统计 离散数学 数据库原理及技术 Linux操作系统 Python语言程序设计 数据分析与可视化 JAVA语言程序设计 Hadoop部署实践 分布式数据库 SPSS统计分析 机器学习 深度学习 数据挖掘 Django开发

项目经历

基于 AI 的特种设备法规智能检索与问答系统

独立完成 · 核心开发者

Java Spring Boot Vue Element-UI Elasticsearch Coze RAG

项目概述

设计并实现了一个融合传统检索与 AI 问答的特种设备法规平台,支持用户上传法规文档并自动完成解析与索引构建,实现文档的结构化存储与多维度组合检索(支持设备类别、国家、章节等条件)。引入 RAG(检索增强生成)架构,基于 Coze 平台构建领域知识库,支持自然语言智能问答,回答结果可追溯原文出处,有效降低大模型幻觉。

主要工作

  • 独立完成平台整体架构设计,包括文件上传模块、数据库建模、多维度检索功能开发
  • 后端基于 Spring Boot 构建 RESTful API,集成 Elasticsearch 实现全文检索与复杂查询
  • 前端基于 Vue + Element-UI 开发单页应用,提供流畅的用户交互体验
  • 基于 Coze 平台构建法规知识库,设计并优化问答 Prompt,利用平台 RAG 能力实现精准 AI 问答与引用溯源

学术论文

Adaptive Hybrid Retrieval-Augmented Generation with Cascaded NLI Verification for University Regulation Question Answering(第三作者)—— 负责特种设备文档数据处理与验证平台搭建,为课题组发表的核心论文提供实验数据支撑与算法验证环境。

基于 RAG 的校园医保政策问答系统

Spring Boot Vue Elasticsearch Coze API RAG

项目概述

为解决校园医保政策查询效率低、信息不准确的问题,设计并实现了 RAG 式智能问答系统。后端基于 Spring Boot 搭建核心服务,前端使用 Vue 构建交互界面,政策文档通过 Elasticsearch 进行索引与高效检索,结合 Coze 大语言模型生成基于政策原文的可靠回答。

主要工作

  • 负责整体系统架构设计与核心模块开发
  • 基于 Elasticsearch 实现全文检索与语义匹配,设计 Top-K 检索策略
  • 设计检索增强生成流程,将用户问题与政策片段智能拼接为 Prompt 调用大模型
  • 构建包含 500 份政策文档、1000 条问答对的测试集,完成全流程测试
准确率 91.2% 语义相似度 0.89 论文在投

基于 BERT 的中文姓名性别分类系统

Python PyTorch Transformers BERT Pandas Scikit-learn

项目概述

构建端到端的中文姓名性别预测系统,基于 bert-base-chinese 预训练模型进行微调优化,将模型准确率从基线 60% 提升至 88.7%。可广泛应用于用户画像构建、数据统计分析、智能表单填写辅助等场景。

主要工作

  • 清洗整合 9 万+ 条姓名-性别标注数据,按 8:1:1 划分训练/验证/测试集
  • 基于 bert-base-chinese 微调,集成 HuggingFace Transformers 简化模型调用
  • 采用数据增强、类别权重调整、超参数调优等策略优化模型性能
  • 封装交互式预测脚本,支持单条/批量姓名预测及置信度输出
准确率 88.7% F1 分数 0.87 9万+ 训练数据

从零实现 GPT 语言模型:基于 PyTorch 的中文新闻生成

Python PyTorch Transformer GPT-2

项目概述

复现 GPT-2 核心架构,独立实现自注意力机制与 Transformer 解码器模块,深入探索大语言模型的底层原理与训练逻辑。完成从数据加载、字符级分词到自回归训练的全流程开发,并成功将模型迁移到中文语料,实现中文新闻生成。

主要工作

  • 独立实现自注意力机制、Transformer 解码器模块,不依赖高级封装 API
  • 编码带掩码的交叉熵损失函数实现 next-token prediction
  • 对比不同模型规模(0.5M-10M 参数)在莎士比亚数据集上的过拟合现象
  • 适配中文语料 3000+ 字符词汇表,运用学习率调度、梯度裁剪技术优化训练

校园经历

信息科学与技术学院分团委副书记

活动策划与执行

  • 策划和组织院内大型活动和校园文化活动
  • 跟进各个活动流程,主导活动从 0 到 1 的全流程
  • 涵盖方案策划、宣传推广与现场统筹,确保活动顺利进行
  • 负责本学院一整年的青马工程活动策划与执行计划

部门管理

  • 负责分团委 4 个部门工作的统筹管理
  • 统筹规划分团委全年工作

班级团支书

  • 负责团支部的日常工作,组织团员学习和开展各类活动
  • 管理团员信息,做好发展团员的评优评先工作
  • 即时传达学院团委的各项指示,解决团员在学习和生活中的各种疑问,提升团支部整体工作效率

个人技能

数据处理与数据库

MySQL 多表连接查询 子查询 窗口函数 视图 Elasticsearch Excel 数据分析 VLOOKUP SUMIF 数据透视表

数据可视化

Power BI 数据清洗 交互式仪表板 Tableau 数据可视化大屏 数据报表

编程与开发

Java 面向对象编程 Spring Boot Vue 前后端分离 Cursor Claude Code Vibe Coding 多模态模型应用 模型选型与集成

系统与工具

Linux 操作系统 文件操作 进程管理 网络配置 Git

分析方法论

AARRR 模型 RFM 模型 群组分析法 假设检验分析法

语言能力

大学英语 CET4

联系我

如果你对我的简历感兴趣,欢迎随时联系我