Feng Yu's Academic Blog

数据科学与人工智能研究 | 探索智能算法的奥秘

Hi,我是冯宇,一名专注于数据科学人工智能领域的研究者。

📧 联系方式

  • 邮箱:19805189125@163.com
  • 电话:19805189125
  • 现居地:北京

🎓 教育经历

中国传媒大学 211 | 计算机科学与技术 硕士

时间:2022年9月 - 2025年7月 | 地点:北京

研究方向:动态因果推理、机器学习模型优化

南京邮电大学 双一流 | 信息管理与信息系统 本科

时间:2018年9月 - 2022年7月 | 地点:南京

💼 工作经历

模型驱动的动态本体引擎与可演进的工业智能系统架构设计

时间:2025年7月 - 至今

项目描述:为解决复杂工业流程(煤层气开采产气量预测)中数据孤岛与语义异构的问题,主导设计了一套模型驱动的动态本体引擎及支撑生态系统。本项目以动态本体作为统一知识表征的基础,集成了多范式AI(物理机理模型、机器学习、因果推理)、高级AI智能体(LLM, RL),旨在构建一个能够实现可演进的工业数字孪生基础设施。

核心职责:

  • 系统顶层架构设计与演进:独立负责动态本体引擎系统V1至V3的核心架构设计与迭代,确立了"内核与能力解耦"的插件化设计范式,显著提升了系统的可扩展性与鲁棒性。设计了涵盖煤层气数据管道、动态本体构建、地质建模、物理数值模拟及AI推理的全流程技术蓝图。构建了"知识表示、智能规划、自主执行、开放API"四层流水线模型,为上层智能应用提供了标准化的能力支撑。
  • AI智能体与物理数值模拟集成:基于ReAct (Reason + Act) 框架,将动态本体引擎封装为大型语言模型(LLM)Agent的核心工具集(Toolkit),赋能Agent通过自然语言理解,自主地进行开放式、多步骤的复杂任务规划与执行(如产量预测)。独立构建并实现了用于产气量预测等下游任务的物理数值模拟求解器,覆盖黑油模型与组分模型,为AI提供了高保真的物理约束。
  • 全景生态系统设计与混合数据集成模式构建:面向多用户角色(如地质工程师、数据科学家)设计了全景人机交互生态,明确并开发了本体工作台、计算注册台等核心功能模块的定位与职责。创新性地设计了"混合数据集成模式",清晰定义了批处理物化(ETL)、流式同步(CDC)和联邦查询三种架构与本体平台的协同工作流,有效解决大规模异构数据源的统一语义化与动态集成难题。

技术栈:Python、图论算法、MySQL、LLM

项目职责:动态本体设计与推理算法设计实现

🎓 研究方向

  • 概率图模型 - 动态不确定性因果图(DUCG)建模与推理
  • 机器学习 - 深度学习、强化学习算法研究与应用
  • 数据分析 - 因果推断、统计建模、业务分析
  • 智能算法 - 群体智能算法优化与博弈论应用

🔬 学术成果

  • 动态不确定性因果图模型理论研究及多领域应用
  • 深度强化学习在游戏AI中的创新应用
  • 机器学习可解释性方法研究
  • 因果推断框架在实际业务中的应用实践

💻 技术项目

  • Alpha Zero五子棋AI - 基于深度强化学习的游戏AI系统
  • 德州扑克对战系统 - 应用CFR算法实现的智能博弈系统
  • 数据分析实战平台 - 涵盖多个行业的数据分析案例集
  • SHAP可解释性工具 - 机器学习模型解释性分析框架

🛠️ 专业技能

专业软件:熟练使用Pytorch、Sklearn等机器学习框架

机器学习:熟悉LR、XGBoost、聚类等机器学习算法,熟悉Transformer等前沿技术

数据分析与可视化工具:熟悉A/B测试、回归分析与贝叶斯推理。熟练使用SPSS、R语言与Python语言,熟悉Numpy、Pandas等数据处理库,熟练掌握Gephi与PowerBI等工具

数据查询工具:熟练掌握MySql,包括增删改查、窗口函数等相关工具

算法结构:熟悉常见数据结构及算法,比如栈、链表、二叉树、十大排序等

语言能力与技能证书:CET-6(488),能够流畅阅读英文文档。计算机二级

🎯 研究兴趣

我致力于将理论研究与实际应用相结合,特别关注:

  • 概率图模型在复杂系统建模中的应用
  • 因果推断方法在业务决策中的价值
  • 深度学习的可解释性与可信AI
  • 强化学习在实际场景中的落地应用

� 其他链接



🎓 学术研究亮点

🧠 概率图模型

动态不确定性因果图(DUCG)理论研究,应用于法律、金融、安全等多个领域

🎮 强化学习

AlphaZero算法优化、CFR博弈算法,在游戏AI领域取得创新突破

📊 因果推断

DoWhy、YLearn框架应用,为业务决策提供科学的因果分析方法

Existence precedes essence, exploration drives growth

Hi, I am 冯宇, a researcher focused on Data Science and Artificial Intelligence.

🎓 Research Areas

  • Probabilistic Graphical Models - Dynamic Uncertain Causality Graph (DUCG) modeling and inference
  • Machine Learning - Deep learning and reinforcement learning algorithms
  • Data Analysis - Causal inference, statistical modeling, and business analytics
  • Intelligent Algorithms - Swarm intelligence optimization and game theory applications

🔬 Academic Achievements

  • Research on Dynamic Uncertain Causality Graph theory and multi-domain applications
  • Innovative applications of deep reinforcement learning in game AI
  • Research on explainable machine learning methods
  • Practical applications of causal inference frameworks in business

💻 Technical Projects

  • Alpha Zero Gomoku AI - Game AI system based on deep reinforcement learning
  • Texas Hold'em Battle System - Intelligent game system using CFR algorithm
  • Data Analysis Platform - Collection of data analysis cases across multiple industries
  • SHAP Explainability Tool - Framework for machine learning model interpretability

�️ Tech Stack

Programming: Python, R, JavaScript, SQL

ML/DL: TensorFlow, PyTorch, Scikit-learn, XGBoost

Data Tools: Pandas, NumPy, Matplotlib, Seaborn, Plotly

Causal Inference: DoWhy, YLearn, CausalML

Others: Git, Docker, Jupyter, VS Code

🎯 Research Interests

I am committed to combining theoretical research with practical applications, particularly focusing on:

  • Applications of probabilistic graphical models in complex system modeling
  • Value of causal inference methods in business decision-making
  • Explainability of deep learning and trustworthy AI
  • Landing applications of reinforcement learning in real scenarios

📫 Contact


🎓 Research Highlights

🧠 Probabilistic Models

DUCG theory research with applications in legal, financial, and security domains

🎮 Reinforcement Learning

AlphaZero optimization and CFR algorithms achieving breakthroughs in game AI

📊 Causal Inference

DoWhy and YLearn framework applications for scientific decision-making


📝 最新文章 Latest Posts

LLM安全与对齐

构建可信赖的大语言模型应用

本文为占位文章。即将更新: 对抗攻击与越狱防御 有毒内容过滤与安全护栏 价值对齐技术(Constitutional AI) 隐私保护与数据安全

LLM推理优化与部署

量化、加速与生产环境部署

训练一个大模型可能需要数百万美元,但让它在生产环境中高效运行,同样是一个价值百万的问题。 LLM 推理优化的核心矛盾是:模型越来越大(70B, 175B),用户对延迟的容忍度却越来越低(希望秒级响应)。如何在有限的硬件资源下,让大模型跑得更快、成本更低? 本文将系统介绍 LLM 推理优化的核心技术:量化、KV-Cache、Flash Attention、以及 vLLM/Te...

多模态大模型技术

从CLIP到GPT-4V的视觉语言理解

人类理解世界并非只依赖文字。我们通过视觉、听觉、触觉等多种感官协同工作,构建对世界的完整认知。多模态大模型让机器首次能够像人类一样跨模态理解和生成内容。 一、CLIP:对比学习的突破 核心思想 CLIP (Contrastive Language-Image Pre-training) 通过对比学习,让图像和文本在同一语义空间中对齐。 对比损失(InfoNCE): \[...

LLM Agent开发指南

构建具有规划与工具调用能力的智能体

如果说大语言模型是”大脑”,那么 Agent(智能体) 就是拥有”手脚”和”工具”的完整个体。 Agent 不仅能思考(LLM 推理),还能行动(调用工具)、记忆(上下文管理)、规划(任务分解)。从自动化客服到科研助手,从代码生成到数据分析,Agent 正在重新定义 AI 的应用边界。 本文将系统介绍 LLM Agent 的核心架构、关键技术,以及使用 LangChain/...

RAG检索增强生成实战

构建企业级知识问答系统

大语言模型虽然强大,但存在致命弱点:知识截止日期和幻觉问题。当你问 GPT-4 关于 2024 年最新事件时,它只能”一脸茫然”;当涉及企业私有数据时,通用模型更是无能为力。 RAG(Retrieval-Augmented Generation,检索增强生成) 为此提供了完美解决方案:它让 LLM 能够”查阅资料”再回答问题,就像给模型配备了一个”外挂知识库”。 RAG 已...

提示工程最佳实践

掌握Prompt设计的艺术与科学

“The hottest new programming language is English.” —— Andrej Karpathy 在大语言模型时代,提示工程(Prompt Engineering) 已经成为一项关键技能。一个精心设计的 prompt 可以让模型的表现提升 10 倍,而糟糕的 prompt 可能让最强大的模型也无法发挥作用。 提示工程不仅仅是”问对问...

高效微调技术:LoRA与PEFT

参数高效微调方法实战

大语言模型的全参数微调(Full Fine-tuning)面临着巨大的挑战:一个 7B 参数的模型,全量微调需要消耗超过 140GB 显存(以 FP32 精度计算),这对于大多数研究者和开发者来说都是难以承受的成本。 参数高效微调(Parameter-Efficient Fine-Tuning, PEFT) 技术应运而生。它们的核心思想是:冻结预训练模型的大部分参数,只训练少量额...

R语言学习

123 R语言项目实战 数据科学从业者调查 首先加载需要使用到的R包 > library(data.table)# fread() > library(tidyverse) # ggplot() 接下来就是读取数据文件,并且查看数据维度。 responses <- fread("C:\\Users\\11603\\Documents\\kaggle-data-m...

LLM训练技术详解

预训练、SFT与RLHF全流程

训练一个大语言模型,就像培养一位博学多才的学者:首先需要”博览群书”(预训练),然后”术业有专攻”(监督微调),最后还要”知道什么是好的回答”(人类反馈对齐)。 从 GPT-3 到 ChatGPT,从 LLaMA 到 Claude,现代 LLM 的训练已经形成了一套成熟的三阶段范式:预训练(Pre-training)→ 监督微调(SFT)→ 人类反馈强化学习(RLHF)。 ...

多人博弈AI设计

三人以上博弈的策略与联盟

在双人零和博弈中(如国际象棋、围棋),胜负是清晰的:我赢你输。但当博弈者增加到三人或更多时,游戏的复杂度发生了质变:联盟、背叛、动态平衡 成为关键要素。 多人博弈(Multiplayer Games)不再是简单的”最大化自己的收益”,而是需要考虑: 何时与他人合作? 如何防止被针对? 何时背叛盟友? 如何平衡风险与收益? 本文将深...