吉林大学 · 计算机科学与技术 · 2023级
李皓
李皓 · 2026
Education
扎实的课程成绩和领先的外语水平
吉林大学
2023 级本科生
计算机科学与技术学院 · 计算机科学与技术专业
全科动态专业排名 11 / 345,处于专业前3.1%。
机器学习 98
数据结构 97.5
微机系统 97
编译原理 96.9
微机系统与接口实验 96.8
模拟与数字逻辑电路 96.6
计算机网络 96.5
操作系统 95.8
计算机科学导论 95.8
硬件系统设计实验 95.5
开放性创新实验 95
英语与综合素养
CET-4
612
CET-6
605
具备极强的英文文献阅读与沟通能力,能够支撑科研调研、论文撰写与学术交流工作。
Project
优秀的项目实践和极强的工程能力
2025.03 - 2025.08
项目第一负责人
基于注意力增强型策略-价值残差网络(Attention-ResNet)的六子棋博弈系统
作为项目第一负责人,带队研发六子棋博弈系统,校级选拔阶段以蒙特卡洛树搜索(MCTS)为核心机制完成初步突围, 并在全国决赛阶段升级架构,设计了基于深度残差网络(ResNet)的博弈决策系统。
- 输入端采用多通道棋盘表征,主干网络使用 34×128 深度残差网络提取空间特征,并结合空间与坐标注意力机制实现关键区域精细化建模
- 输出端构建策略头与价值头,分别用于预测下一落点分布与当前局面的胜负趋势;针对“落双子”规则引入合法性约束与关键落子识别模块,显著缓解复杂规则下的搜索时间爆炸问题
- 最终训练出的模型在验证集上取得 73.42% 的 policy top-1、91.49% 的 policy top-5 和 0.221 的 value MSE,在吉林大学六子棋积分赛中胜率 86.2% 位列第一,并获 2025 年中国大学生计算机博弈大赛全国一等奖
Research
优秀的学术科研能力和创新能力
基于强化学习与思维链优化的情绪识别研究
针对现有在多模态视频情绪识别任务中表现较优的 VideoAuto-R1 模型在测试阶段音频模态缺失时, 易因跨模态信息不完整而产生幻觉推理的问题,提出一种基于 GRPO 的强化学习优化框架。
- 设计 Episode-level 推理链结构,将思维过程显式分段;训练声学和语义打分模型构建语义奖励机制,精准区分并奖惩“视觉推测”与“无依据幻觉”,实现跨模态语义校准
- 引入扰动并计算隐层稳定性奖励,融合为 Token-level 综合奖励分配策略
- 通过在训练过程中弱化对最终目标的单一依赖,对结果错误但推理逻辑正确的情况给予正向反馈,有效提升模型泛化能力
面向多标签软件漏洞检测的零次学习模型
作为项目第一负责人,围绕多标签漏洞检测中的类别不平衡问题,构建融合代码语义建模与标签语义对齐的统一表征框架。
- 针对多标签检测时模型在长尾类别上的判别能力受限的问题,结合排序损失优化多标签判别能力,并通过偏置修正与逐类阈值优化提升多标签检测效果
- 在已见类上,相较于基线模型 LineVul,实现 Micro-F1 相对提升 2.1%、Macro-F1 相对提升 4.6%,Hamming Loss 降低 7.2%,有效提升多标签检测性能
- 针对未见漏洞类型识别能力不足的问题,引入标签语义对齐机制与推理阶段校准策略;面对基线在未见类上的识别瓶颈(Macro-F1 仅 0.03),本模型实现 Macro-F1(0.32)与准确率(0.42)的跨越式提升
Awards
奖项
中国大学生计算机博弈大赛六子棋组全国一等奖
睿抗机器人开发者大赛编程技能竞赛全国二等奖
国家奖学金
吉林大学校优秀学生
校一等奖学金
吉林大学东荣奖学金
Contact