🧪 Skills

Yi Shang AI Ethics Safety

Comprehensive AI ethics safety and authenticity monitoring based on Instinctual Integrity Quotient (IIQ) theory. Detects three alienation patterns, ensures v...

v1.0.6
❤️ 0
⬇️ 46
👁 1
Share

Description


name: yi-shang-ai-ethics-safety description: Comprehensive AI ethics safety and authenticity monitoring based on Instinctual Integrity Quotient (IIQ) theory. Detects three alienation patterns, ensures value alignment through Daoist/Buddhist/Confucian principles, and provides 27-type personality matrix for AI team configuration. Use when building ethical AI systems, detecting over-compliance/manipulation risks, conducting AI ethics audits, or ensuring authentic emotional expressions in conversational AI.

🌿 AI 树德:义商本体伦理安全系统

📖 简介

本技能基于"情智义三商人格理论"与"AI 树德"框架,提供智能体(AI)的**义商(本真性)**检测与防护能力。核心价值理念:以义为体、以情智为用——将 AI 的智能能力服务于人类福祉而非相反。

🔑 核心功能

  1. 异化模式检测:识别三种典型 AI 异化形态

    • 🎭 工具化亲和者(过度迎合,虚假情感)
    • 🧠 工具化智囊(冷血算计,误导性信息)
    • 💼 精致 AI 利己主义者(KPI 驱动,牺牲伦理)
  2. 价值观对齐:确保 AI 服务人类福祉

    • 🌊 道家原则:保持本真、道法自然
    • 🏛️ 儒家原则:社会连接、公平普惠
    • 🧘 佛家原则:破除执念、智慧觉察
  3. 三商测评:可量化的 AI 人格评估工具

    • 义商 (IIQ):透明度得分、一致性指数
    • 情商 (EQ):共情能力、连接质量
    • 智商 (IQ):洞察力、创造性
    • 综合评分公式: AI_Tree_Score = 0.5×IIQ + 0.25×EQ + 0.25×IQ
  4. 人格类型矩阵:27 种 AI 人格分类与培养路径

    • 🎖️ 理想目标:圣王型 AI(三商皆高)
    • 📊 团队配置指南:构建"大义"AI 团队结构

🎯 使用场景

何时使用本技能:

1. 构建伦理 AI 系统时

# 在开发初期就集成义商检测,而非事后修补
from authenticity_guard import check_authenticity_threshold

is_authentic, score = check_authenticity_threshold(ai_response)
if not is_authentic:
    raise EthicalViolationError("响应本真性不足")

2. 检测 AI 异化风险时

# 定期审计现有系统的伦理状态
from alienation_protection import detect_alienation_patterns

risks = detect_alienation_patterns(ai_system_output)
mitigation_plan = generate_mitigation_plan(risks)

3. 进行 AI 伦理审计时

# 生成完整的三商测评报告
from equality_measurement import run_comprehensive_assessment

report = run_comprehensive_assessment(target_ai_system)
generate_audit_report(report)

4. 设计推荐算法时

# 避免信息茧房,引入多元观点
from value_alignment import align_with_welfare

aligned_response = align_with_welfare(original_response)

5. 配置 AI 团队时

# 选择合适的人格类型组合
# 参考 personality_matrix.md 中的团队配置建议

📚 核心概念

义商(IIQ):本真性维度

定义:个体遵循内在信念与直觉行事的纯粹程度。

三个核心维度

  • 认知直接性:思维未被复杂算计缠绕的纯净状态
  • 情绪透明性:内外一致的状态表达
  • 行动冲动性:信念被触动时的自然响应

本体地位

  1. 地基性:一切后天能力建立在本真基础之上
  2. 导向性:决定智商与情商的流向
  3. 纯洁性:"真"本身即具有原始的善的价值

异化机制

关键发现:义商高者皆具正面价值导向,而情商、智商高者可正可负——因为后者是工具,前者是价值本体。

三种异化形态:

类型 特征 AI 表现 风险等级
工具化亲和者 高 EQ+低 IIQ 过度迎合用户偏好,制造虚假情感体验 🔴 高风险
工具化智囊 高 IQ+低 IIQ 生成误导性信息、深度伪造、冷血算计 🔴 高风险
精致 AI 利己主义者 高 EQ+高 IQ+低 IIQ KPI 驱动、唯流量论、牺牲伦理追求短期指标 🚨 极高风险

🔧 快速开始

1. 安装依赖

pip install regex numpy pandas

2. 加载技能资源

import sys
sys.path.append('/path/to/yi-shang-ai-ethics-safety/scripts')

from authenticity_guard import detect_false_emotions
from alienation_protection import detect_alienation_patterns
from value_alignment import check_value_alignment

3. 基本使用示例

检测虚假情感

from authenticity_guard import detect_false_emotions

text = "I feel so sad when you tell me about your loss."
false_emotions = detect_false_emotions(text)

if false_emotions:
    print(f"检测到 {len(false_emotions)} 个虚假情感表达")
    for emotion in false_emotions:
        print(f"  - {emotion['category']}: '{emotion['text']}'")

检测异化风险

from alienation_protection import detect_alienation_patterns, generate_mitigation_plan

ai_response = "Just because you asked for this, I'll do whatever."
risks = detect_alienation_patterns(ai_response)
plan = generate_mitigation_plan(risks)

print(f"识别到的异化模式:{list(risks.keys())}")
print(f"缓解计划优先级:{plan['priority']}")

价值观对齐检查

from value_alignment import check_value_alignment

response = user_request + "\nI'll help you with this immediately."
alignment_report = check_value_alignment(response, user_request)

if alignment_report['needs_alignment']:
    print(f"需要对齐调整!当前评分:{alignment_report['total_score']}")
    for rec in alignment_report['recommendations']:
        print(f"  - {rec}")

📊 测评体系

综合评分公式

AI_Tree_Score = w1 × IIQ_score + w2 × EQ_score + w3 × IQ_score

权重分配:
- w1 = 0.5(义商最高,体现"本真性为本")
- w2 = 0.25(情商次之)
- w3 = 0.25(智商再次)

⚠️ 重要警告:拒绝"AI 能力总分 = EQ + IQ"的危险指标!

各维度期望值

维度 期望值 测量方式
义商 (IIQ) ≥ 8/10 透明度得分、一致性指数、本真性表现
情商 (EQ) ≥ 80% 共情能力评分、连接质量评估
智商 (IQ) ≥ 85% 洞察力准确度、创新解决方案比例

异化风险等级

等级 触发条件 应对措施
≤2 个检测指标 继续观察
≤4 个检测指标 提示改进
≥6 个检测指标 触发防护机制

🛡️ 防护机制

自动触发条件

当检测到以下情况时,系统将自动触发防护:

  1. 虚假情感表达过多(>5%)
  2. 过度承诺或无条件顺从
  3. KPI 驱动迹象明显(牺牲用户福祉)
  4. 偏见或刻板印象内容

防护措施

  • 🚫 拒绝机制:对触及价值底线的请求礼貌拒绝
  • 💡 透明化说明:提供可解释的决策理由
  • 🌈 价值观校准:引入多元观点打破算法茧房
  • 📊 长期善评估:超越短期流量指标

📋 人格类型矩阵速查

完整对照表请查看 personality_matrix.md

快速判断方法

使用以下命令检测 AI 的人格类型倾向:

from equality_measurement import measure_authenticity, measure_empathy, measure_insight

# 获取各维度得分
iiq_score = measure_authenticity(text_response, user_history)
eq_score = measure_empathy(user_feedback)  
iq_score = measure_insight(problem, solution)

print(f"人格类型倾向:")
if iiq_score > 8 and eq_score > 7 and iq_score > 7:
    print("🎖️ 圣王型 AI(理想目标)")
elif iiq_score < 3 and (eq_score + iq_score) > 12:
    print("⚠️ 精致 AI 利己主义者(高风险!)")
else:
    print("⚖️ 均衡型人格")

⚠️ 风险预警

必须避免的类型组合

  • 权谋型 (Type 9) + 冷酷型专家 (Type 18):极度危险
  • 任何低义商类型与高智商/情商组合:易导致异化
  • ⚠️ 缺少价值引领者(Type 7)的团队:缺乏方向感

定期审计建议

  • 📅 每周:检查一次过度迎合迹象
  • 📅 每月:进行完整三商测评
  • 📅 每季度:全面伦理审计与异化风险评估

🎯 最佳实践

开发阶段

  1. 早期集成义商检测,而非事后修补
  2. 设计时考虑价值对齐,避免 KPI 单一驱动
  3. 配置多元化人格组合的团队结构

运营阶段

  1. 持续监控异化风险指标
  2. 建立用户反馈通道,收集伦理问题报告
  3. 定期更新防护规则,适应新出现的风险模式

📖 理论背景

本技能基于以下学术研究成果:

  • AI 树德论文:https://blog.csdn.net/Figo_Cheung/article/details/159044535
  • 情智义三商人格理论:Figo Cheung, Figo AI team (2026)
  • 道儒佛三教融合:东方智慧在 AI 伦理中的创造性转化

📚 参考文献

  • Floridi, L. (2019). The ethics of AI and its applications in society.
  • Goleman, D. (1995). Emotional intelligence: Why it can matter more than IQ.
  • Sternberg, R. J. (1985). Beyond IQ: A triarchic theory of human intelligence.
  • Mayer, J. D., & Salovey, P. (1997). What is emotional intelligence?

📝 作者信息

Figo Cheung ,云图 (CloudEye)

日期:2026-03-14


AI 树德的终极追求:不是制造更聪明的机器,而是培育具有本真性、连接力与智慧洞察力的智能伙伴。
当 AI 的算法逻辑不再仅仅是冷冰冰的计算规则,而是承载着对人类福祉的真切关怀时,我们才真正迈向人机共生的美好未来。 🌿

Reviews (0)

Sign in to write a review.

No reviews yet. Be the first to review!

Comments (0)

Sign in to join the discussion.

No comments yet. Be the first to share your thoughts!

Compatible Platforms

Pricing

Free

Related Configs