大语言模型 AI安全价值对齐可信AI

LLM安全与对齐

构建可信赖的大语言模型应用

Posted by Feng Yu on November 3, 2024

本文为占位文章。即将更新：

对抗攻击与越狱防御
有毒内容过滤与安全护栏
价值对齐技术（Constitutional AI）
隐私保护与数据安全

💬 交流与讨论

⚠️ 尚未完成 Giscus 配置。请在 _config.yml 中设置 repo_id 与 category_id 后重新部署，即可启用升级后的评论系统。

配置完成后，评论区将自动支持 Markdown 代码高亮与 LaTeX 数学公式渲染，访客回复会同步到 GitHub Discussions，并具备通知功能。