LLM安全与对齐

构建可信赖的大语言模型应用

Posted by Feng Yu on November 3, 2024

本文为占位文章。即将更新:

  • 对抗攻击与越狱防御
  • 有毒内容过滤与安全护栏
  • 价值对齐技术(Constitutional AI)
  • 隐私保护与数据安全

💬 交流与讨论

⚠️ 尚未完成 Giscus 配置。请在 _config.yml 中设置 repo_idcategory_id 后重新部署,即可启用升级后的评论系统。

配置完成后,评论区将自动支持 Markdown 代码高亮与 LaTeX 数学公式渲染,访客回复会同步到 GitHub Discussions,并具备通知功能。