Feng Yu's Academic Blog

数据科学与人工智能研究 | 探索智能算法的奥秘

Hi,我是冯宇,一名专注于数据科学人工智能领域的研究者。

📧 联系方式

  • 邮箱:19805189125@163.com
  • 电话:19805189125
  • 现居地:北京

🎓 教育经历

中国传媒大学 211 | 计算机科学与技术 硕士

时间:2022年9月 - 2025年7月 | 地点:北京

研究方向:动态因果推理、机器学习模型优化

南京邮电大学 双一流 | 信息管理与信息系统 本科

时间:2018年9月 - 2022年7月 | 地点:南京

💼 工作经历

模型驱动的动态本体引擎与可演进的工业智能系统架构设计

时间:2025年7月 - 至今

项目描述:为解决复杂工业流程(煤层气开采产气量预测)中数据孤岛与语义异构的问题,主导设计了一套模型驱动的动态本体引擎及支撑生态系统。本项目以动态本体作为统一知识表征的基础,集成了多范式AI(物理机理模型、机器学习、因果推理)、高级AI智能体(LLM, RL),旨在构建一个能够实现可演进的工业数字孪生基础设施。

核心职责:

  • 系统顶层架构设计与演进:独立负责动态本体引擎系统V1至V3的核心架构设计与迭代,确立了"内核与能力解耦"的插件化设计范式,显著提升了系统的可扩展性与鲁棒性。设计了涵盖煤层气数据管道、动态本体构建、地质建模、物理数值模拟及AI推理的全流程技术蓝图。构建了"知识表示、智能规划、自主执行、开放API"四层流水线模型,为上层智能应用提供了标准化的能力支撑。
  • AI智能体与物理数值模拟集成:基于ReAct (Reason + Act) 框架,将动态本体引擎封装为大型语言模型(LLM)Agent的核心工具集(Toolkit),赋能Agent通过自然语言理解,自主地进行开放式、多步骤的复杂任务规划与执行(如产量预测)。独立构建并实现了用于产气量预测等下游任务的物理数值模拟求解器,覆盖黑油模型与组分模型,为AI提供了高保真的物理约束。
  • 全景生态系统设计与混合数据集成模式构建:面向多用户角色(如地质工程师、数据科学家)设计了全景人机交互生态,明确并开发了本体工作台、计算注册台等核心功能模块的定位与职责。创新性地设计了"混合数据集成模式",清晰定义了批处理物化(ETL)、流式同步(CDC)和联邦查询三种架构与本体平台的协同工作流,有效解决大规模异构数据源的统一语义化与动态集成难题。

技术栈:Python、图论算法、MySQL、LLM

项目职责:动态本体设计与推理算法设计实现

🎓 研究方向

  • 概率图模型 - 动态不确定性因果图(DUCG)建模与推理
  • 机器学习 - 深度学习、强化学习算法研究与应用
  • 数据分析 - 因果推断、统计建模、业务分析
  • 智能算法 - 群体智能算法优化与博弈论应用

🔬 学术成果

  • 动态不确定性因果图模型理论研究及多领域应用
  • 深度强化学习在游戏AI中的创新应用
  • 机器学习可解释性方法研究
  • 因果推断框架在实际业务中的应用实践

💻 技术项目

  • Alpha Zero五子棋AI - 基于深度强化学习的游戏AI系统
  • 德州扑克对战系统 - 应用CFR算法实现的智能博弈系统
  • 数据分析实战平台 - 涵盖多个行业的数据分析案例集
  • SHAP可解释性工具 - 机器学习模型解释性分析框架

🛠️ 专业技能

专业软件:熟练使用Pytorch、Sklearn等机器学习框架

机器学习:熟悉LR、XGBoost、聚类等机器学习算法,熟悉Transformer等前沿技术

数据分析与可视化工具:熟悉A/B测试、回归分析与贝叶斯推理。熟练使用SPSS、R语言与Python语言,熟悉Numpy、Pandas等数据处理库,熟练掌握Gephi与PowerBI等工具

数据查询工具:熟练掌握MySql,包括增删改查、窗口函数等相关工具

算法结构:熟悉常见数据结构及算法,比如栈、链表、二叉树、十大排序等

语言能力与技能证书:CET-6(488),能够流畅阅读英文文档。计算机二级

🎯 研究兴趣

我致力于将理论研究与实际应用相结合,特别关注:

  • 概率图模型在复杂系统建模中的应用
  • 因果推断方法在业务决策中的价值
  • 深度学习的可解释性与可信AI
  • 强化学习在实际场景中的落地应用

� 其他链接



🎓 学术研究亮点

🧠 概率图模型

动态不确定性因果图(DUCG)理论研究,应用于法律、金融、安全等多个领域

🎮 强化学习

AlphaZero算法优化、CFR博弈算法,在游戏AI领域取得创新突破

📊 因果推断

DoWhy、YLearn框架应用,为业务决策提供科学的因果分析方法

Existence precedes essence, exploration drives growth

Hi, I am 冯宇, a researcher focused on Data Science and Artificial Intelligence.

🎓 Research Areas

  • Probabilistic Graphical Models - Dynamic Uncertain Causality Graph (DUCG) modeling and inference
  • Machine Learning - Deep learning and reinforcement learning algorithms
  • Data Analysis - Causal inference, statistical modeling, and business analytics
  • Intelligent Algorithms - Swarm intelligence optimization and game theory applications

🔬 Academic Achievements

  • Research on Dynamic Uncertain Causality Graph theory and multi-domain applications
  • Innovative applications of deep reinforcement learning in game AI
  • Research on explainable machine learning methods
  • Practical applications of causal inference frameworks in business

💻 Technical Projects

  • Alpha Zero Gomoku AI - Game AI system based on deep reinforcement learning
  • Texas Hold'em Battle System - Intelligent game system using CFR algorithm
  • Data Analysis Platform - Collection of data analysis cases across multiple industries
  • SHAP Explainability Tool - Framework for machine learning model interpretability

�️ Tech Stack

Programming: Python, R, JavaScript, SQL

ML/DL: TensorFlow, PyTorch, Scikit-learn, XGBoost

Data Tools: Pandas, NumPy, Matplotlib, Seaborn, Plotly

Causal Inference: DoWhy, YLearn, CausalML

Others: Git, Docker, Jupyter, VS Code

🎯 Research Interests

I am committed to combining theoretical research with practical applications, particularly focusing on:

  • Applications of probabilistic graphical models in complex system modeling
  • Value of causal inference methods in business decision-making
  • Explainability of deep learning and trustworthy AI
  • Landing applications of reinforcement learning in real scenarios

📫 Contact


🎓 Research Highlights

🧠 Probabilistic Models

DUCG theory research with applications in legal, financial, and security domains

🎮 Reinforcement Learning

AlphaZero optimization and CFR algorithms achieving breakthroughs in game AI

📊 Causal Inference

DoWhy and YLearn framework applications for scientific decision-making


📝 最新文章 Latest Posts

深度Q网络案例实践

从理论到代码:完整实现DQN算法解决CartPole问题

引言 深度Q网络(Deep Q-Network,DQN)是强化学习与深度学习结合的里程碑算法。本文将通过完整的代码实现,详细展示如何使用DQN解决OpenAI Gym的CartPole环境问题。 1. DQN算法原理回顾 1.1 Q-Learning基础 Q-Learning是一种无模型的强化学习算法,其核心是学习动作价值函数: \[Q(s,a) = r + \gamma \max...

新型群体智能算法对比实验

123

数据分析实战—DoWhy酒店案例实战


应用Ylearn框架实现因果推断

从相关到因果:用 YLearn 解锁数据的真正价值

引言 在数据科学领域,我们经常听到这样一句话:”相关不代表因果”(Correlation does not imply causation)。传统的机器学习方法擅长发现数据中的模式和相关性,但在回答”为什么”以及”如果这样做会怎样”等因果问题时却力不从心。 因果推断(Causal Inference)正是解决这一问题的关键技术。无论是在医疗健康(新药是否有效?)、营销决策(优惠券是否真的...

应用SHAP库实现机器学习可解释性

深入理解 SHAP 值原理,掌握模型解释的实战技巧

引言 在现代机器学习应用中,模型的可解释性变得越来越重要。无论是在金融风控、医疗诊断还是司法判决等领域,我们不仅需要知道模型”给出了什么结果”,更需要理解模型”为什么给出这个结果”。SHAP(SHapley Additive exPlanations)作为一种基于博弈论的模型解释方法,已经成为业界最流行的可解释性工具之一。 本文将深入介绍 SHAP 的理论基础、核心算法,并通过丰富的实战...

应用CFR实现德州扑克对战

引言 反事实后悔最小化(Counterfactual Regret Minimization, CFR)是求解不完全信息博弈纳什均衡的经典算法。本文先用最小博弈 Kuhn Poker 给出完整 CFR 实现,再给出在德州扑克中的工程化落地思路(抽象与对手建模)。 1. CFR 核心思想 信息集(Information Set):在不完全信息下,玩家对状态的可观测等价类 策略:...

动态不确定性因果图模型理论在金融领域的应用

构建金融风控与市场预测的因果罗盘

金融市场是一个由亿万节点(投资者、机构、资产)相互连接而成的、高度复杂的动态系统。在这个系统中,风险和信息以非线性的方式瞬时传播,一个看似微小的事件(如一家小型银行的流动性危机)可能通过层层传导,引发一场全球性的“蝴蝶效应”。 长期以来,金融建模严重依赖相关性分析(如多元回归、时间序列)。然而,“相关不等于因果”的魔咒始终困扰着金融界:高相关性的模型在市场结构发生突变时(如黑天鹅...

动态不确定性因果图模型理论在软件可靠性领域的应用

从"日志风暴"到"智能根因诊断"

在当今这个由代码驱动的世界里,软件系统的可靠性(Reliability)是决定业务成败的生命线。然而,随着微服务架构、容器化和云原生技术的普及,软件系统正演变为一个“牵一发而动全身”的超复杂网络。一个微小的、潜藏在深层服务中的Bug,就可能引发一场席卷整个系统的“级联故障”(Cascading Failure)。 传统的软件可靠性保障手段(如单元测试、日志监控)正变得力不从心。当...

DUCG在网络安全领域的应用

构建下一代智能态势感知与攻击溯源系统

现代网络安全攻防早已进入“非对称”战争。攻击者(APT组织、黑客)利用精心策划、多阶段、慢渗透的攻击链,隐匿在海量的正常业务流量中;而防御方则被动地淹没在由IDS、SIEM、EDR等各种安全设备产生的、数以万计的“告警风暴”中。 传统安全运维(SecOps)的最大痛点在于“见木不见林”。我们能看到1000个独立的告警,却无法将其中那5个真正相关的告警串联成一个完整的“攻击故事”。...

动态不确定性因果图模型理论在法律领域的应用

一种面向司法推理的数据分析新范式

法律的核心是事实认定与因果归责。在司法实践中,法官和律师们面对的往往是海量的、碎片化的,甚至充满矛盾的证据。如何从这些不确定的信息中,构建一个严密的逻辑链条,并推断出最接近真相的“法律事实”,是司法体系永恒的挑战。 传统的法律推理严重依赖人类专家的经验和直觉,但在面对高度复杂、数据海量的现代案件(如金融欺诈、网络犯罪)时,正暴露出局限性。而以**动态不确定因果图(DUCG)**为...