教育背景
硕士 计算机技术
2023 - 2026
宁波大学 深度学习/图像处理/高等工程数学
本科 计算机科学与技术
2019 - 2023
宁波大学 数据结构/算法/计算机网络/无线网络
项目经历
华为 AIGC模型微调 、多媒体安全、水印算法插件化部署
面向AIGC溯源证真的大容量数字水印技术开发
2024.12 - 2025.12
- 项目描述:面向AIGC生成内容嵌入大容量不可见隐水印,应用于图像(Diffusion/Flux)、视频(tts)、音频生成模型,用于对生成内容进行用户溯源;难点:嵌入大容量C2PA凭证信息(远大于常见水印算法)、有可移植性,且对正常业务流程与生成质量不造成显著影响。
- 习得内容:提出了高效的水印嵌入方法成功解决水印对图像的视觉影响问题,并且可以嵌入1KB水印信息,应用于AIGC图像、音频、视频生成流程,并且可以抵抗常见失真攻击;扩展到Diffusion WebUI、ComfyUI及Diffusers等主流AIGC项目的插件编写;并利用LoRA微调技术及ControlNet应用于AIGC模型的隐水印嵌入方案,近一步提高水印鲁棒性。
阿里巴巴 多媒体安全、数字图像隐水印嵌入与擦除技术
对抗环境下图像水印攻防算法研究
2023.10 - 2024.5
- 项目描述:面向对抗环境下的图像不可见隐水印攻防研究,针对非恶意攻击(如社交平台图像压缩算法)与恶意攻击的理论研究;研究水印嵌入与去除工作,旨在去除图像中的任意不可见水印。
- 习得内容:掌握了AIGC图像(Diffusion/Transformer/VAE)生成模型的原理与算法实现,了解不同模型的局限性与优势,清晰阐述复杂技术方案,并提供相对的设计方案。
基于Dify和n8n的雅思口语语料库生成工作流
2025.9 - 至今
- 项目描述:使用Dify和n8n搭建智能工作流,根据输入的雅思口语问题,实时生成符合指定人设的语料回答,包含思路分析、内容回复、语法解析三个核心模块;特色:融合中文互联网热梗、英文俚语等生活化口语表达,提升语料的实用性和趣味性。
- 技术实现:采用Agentic RAG架构进行知识检索与语料生成,利用LoRA微调技术优化模型的人设一致性和回答质量,通过API调用实现各组件间的高效协作;构建了包含问题分析→思路生成→内容输出→语法标注的完整。
个人描述
算法知识:熟悉AIGC图像生成原理与趋势,如DiT/Flux/Autoregressive生成构架的局限性与优势,熟悉生成流程中各环节;熟悉数字媒体(图像/音频/视频)的不可见隐水印算法架构,精通在图像生成过程内嵌入隐水印
编程语言与动手能力:熟练Python编程与PyTorch框架,熟悉Linux开发环境并高效使用Linux日常命令,具备AIGC模型从原理到应用,模型部署,工作流搭建能力;精通shell自动化脚本,git代码管理;了解docker应用,熟悉Markdown语言与博客撰写
语言与学习能力具备出色的中英双语沟通能力(雅思总分7.0,口语7.5),能流畅进行跨文化技术交流与协作;较强独立学习力,能快速掌握新技术与新知识;擅长信息检索、分析与解决问题,以及出色的PPT制作与汇报能力
论文
ISCAS 2025收录 - 中科院三区 第一作者
2025.5
Diversity Preserving Robust Watermarking for Diffusion Model Generated Images
TCSVT 在投 - 中科院一区 第一作者
2025.5
High-Fidelity Universal Watermarking for Images : A Latent Space Approach with Noise Blending
奖项
第二十一届中国研究生数学建模竞赛 二等奖(排名前3%)
2024.11
第二十届中国研究生数学建模竞赛 三等奖
2023.11
2020全国大学生数学建模竞赛 省一等奖
2020.11
2021美国大学生数学建模竞赛 Honor奖
2021.02
技术栈
编程: Python(pyTorch; Pandas; Huggingface; Matplotlib); Docker ; Git ; Shell; JavaScript
写作: Markdown; LateX;
办公: PPT ; Photoshop ; LightRoom ; Premiere
语言: Chinese (母语); English (IELTS 7.0)