🧪 Skills
industry-news-collector
行业新闻聚合与热度排序工具。当用户询问XX行业的最新动态时触发,如:"今天有什么XX行业新闻?""总结一下这周的XX行业动态""最近XX行业有什么热点
v1.0.0
Description
name: industry-news-collector description: 行业新闻聚合与热度排序工具。当用户询问XX行业的最新动态时触发,如:"今天有什么XX行业新闻?""总结一下这周的XX行业动态""最近XX行业有什么热点?"。覆盖:新产品发布、行业动态、融资新闻、技术突破、政策变化等。输出中文摘要列表,按热度排序,附带原文链接。
Industry News Collector
收集、聚合并按热度排序指定行业的新闻。
核心原则
不要只搜"XX行业新闻"。 泛搜索返回的是 SEO 聚合页和趋势预测文章,会系统性遗漏社区级病毒传播现象(如开源工具爆火、Meme 级事件)。必须用多维度、分层搜索策略。
明确行业边界。 每个行业都有其特定的范围和边界,必须严格定义目标行业的核心内容,排除相关但不相关的行业资讯。
行业边界定义
定义方法
- 核心术语法:通过列举目标行业的核心术语来定义行业范围
- 负面排除法:明确列出应排除的相关但不相关的行业术语
- 来源验证法:通过确认新闻来源的行业属性来验证内容相关性
示例:氢能行业边界
包含:
- 氢气的生产、储运和应用
- 氢燃料电池技术和产品
- 加氢站基础设施
- 氢能源政策和市场
- 绿氢、蓝氢、灰氢相关技术
排除:
- 风能、太阳能、光伏等其他可再生能源
- 传统化石能源(石油、天然气、煤炭)
- 核能
- 生物质能、地热能、潮汐能
边界判断标准
- 主要内容原则:新闻的主要内容必须是目标行业
- 核心术语原则:新闻必须包含目标行业的核心术语
- 来源相关原则:新闻来源必须与目标行业相关
工作流程
1. 多维度分层搜索(最少 8 次,建议 10-12 次)
按以下 5 个维度 依次执行搜索,每个维度至少 1 次:
维度 A:周报/Newsletter 聚合(最优先 🔑)
这是信息密度最高的来源,一篇文章可覆盖 10+ 条新闻。
搜索词:
- "last week in XX行业" [当前月份年份]
- "XX行业 周报" [当前月份年份]
发现周报后,用 web_fetch 获取全文,从中提取所有新闻线索。
维度 B:产品发布
搜索词:
- "XX行业 产品发布" [当前月份]
维度 C:融资与商业
搜索词:
- "XX行业 融资" [当前月份年份]
- "XX行业 商业" [当前月份年份]
- "XX行业 投资" [当前月份年份]
维度 D:研究突破
搜索词:
- "XX行业 研究突破" [当前月份]
- "XX行业 论文" [当前月份]
- "XX行业 技术突破" [当前月份]
维度 E:监管与政策
搜索词:
- "XX行业 监管" [当前月份年份]
- "XX行业 政策" [当前月份年份]
- "XX行业 法律" [当前月份年份]
- "XX行业 治理" [当前月份年份]
2. 交叉验证与补漏
初轮搜索完成后,执行以下交叉验证步骤:
2.1 行业相关性验证
- 核心术语验证:确保新闻内容包含目标行业的核心术语
- 负面关键词检查:确认新闻内容不包含应排除的相关行业术语
- 来源验证:确认新闻来源与目标行业相关
2.2 热点事件验证
- 如果 Newsletter 中提到了某个项目/事件但初轮搜索未覆盖 → 对该项目专项搜索,同时验证其行业属性
- 如果同一事件被 3+ 个不同来源提及 → 大概率是热点,深入搜索获取更多细节,同时确认其行业属性
- 如果中文媒体和英文媒体的热点完全不同 → 两边都要覆盖,但都需验证行业相关性
2.3 边缘案例处理
- 跨行业事件:如果事件涉及多个行业,评估目标行业在其中的权重和相关性
- 相关行业新闻:如果新闻主要讨论相关行业,仅在目标行业是核心内容时才包含
- 背景提及:如果新闻仅在背景中提及目标行业,应排除
3. 搜索关键词设计原则(反模式清单)
| ❌ 不要这样搜 | ✅ 应该这样搜 | 原因 |
|---|---|---|
| 搜索词中加具体年月日 | 用 "本周" "今日" "最新" | 日期反而会偏向预测/展望文章 |
| 只搜 3 次就开始写 | 至少 8 次,覆盖 6 个维度 | 3 次搜索覆盖率不到 30% |
| 只使用通用行业名称 | 结合行业特定术语 | 通用名称会带来大量无关信息 |
| 不设置负面关键词 | 明确排除相关但不相关的行业 | 避免误纳入相邻行业资讯 |
4. 行业特定搜索词库
氢能行业
核心术语:
- 氢能
- 氢燃料电池
- 氢能源
- 氢气生产
- 氢储运
- 加氢站
- 氢燃料电池汽车
- 绿氢
- 蓝氢
- 灰氢
负面关键词(需排除):
- 风能
- 太阳能
- 光伏
- 风电
- 生物质能
- 地热能
- 潮汐能
- 核能
搜索策略:
- 每次搜索都包含核心术语
- 在搜索结果中过滤包含负面关键词的内容
- 优先使用专业氢能媒体和研究机构的内容
5. 热度综合判断
基于以下信号评估每条新闻热度(1-5 星):
| 信号 | 权重 | 说明 |
|---|---|---|
| 多家媒体报道同一事件 | ⭐⭐⭐ 高 | 3+ 来源 = 确认热点 |
| 来自权威来源 | ⭐⭐⭐ 高 | 政府或官方机构发布 |
| 技术突破性/影响范围 | ⭐⭐ 中 | |
| 时效性(越新越热) | ⭐⭐ 中 | 辅助排序 |
6. 输出格式
按热度降序排列,输出 15-25 条新闻:
## 🔥 {行业} 新闻速递(YYYY-MM-DD)
### ⭐⭐⭐⭐⭐ 热度最高
1. **[新闻标题]**
> 一句话摘要(不超过 50 字)
> 🔗 [来源名称](URL)
### ⭐⭐⭐⭐ 高热度
2. ...
### ⭐⭐⭐ 中等热度
...
---
📊 本次共收集 XX 条新闻 | 搜索 XX 次 | 覆盖维度:A/B/C/D/E | 更新时间:HH:MM
7. 去重与合并
- 同一事件被多家报道时,合并为一条,选择最权威/详细的来源
- 在摘要中注明"多家媒体报道"以体现热度
- 改名/更名的项目视为同一事件(如 Clawdbot → Moltbot → OpenClaw)
8. 内容筛选机制
行业相关性判断标准
高相关性(必须包含):
- 新闻标题或正文明确提及目标行业的核心术语
- 新闻内容直接讨论目标行业的产品、技术、政策或市场
- 新闻来源是目标行业的专业媒体或研究机构
中相关性(谨慎包含):
- 新闻标题或正文提及目标行业的相关术语
- 新闻内容间接涉及目标行业,但不是主要焦点
- 新闻来源是综合性媒体,而非专业行业媒体
低相关性(应排除):
- 新闻标题和正文均未提及目标行业的核心术语
- 新闻内容主要讨论其他行业,仅在背景中提及目标行业
- 新闻来源与目标行业无关
筛选流程
- 初步筛选:基于搜索关键词和负面关键词进行过滤
- 深度筛选:分析新闻标题和正文,评估行业相关性
- 来源筛选:优先选择行业专业媒体和权威机构的内容
- 交叉验证:通过多个来源确认新闻的行业属性
推荐新闻源
注意事项
- 优先使用 HTTPS 链接
- 遇到付费墙/无法访问的内容,标注"需订阅"
- 保持客观,不对新闻内容做主观评价
- 搜索不足 8 次不要开始输出
- 如果某个维度搜索结果为空,换关键词再搜一次
Reviews (0)
Sign in to write a review.
No reviews yet. Be the first to review!
Comments (0)
No comments yet. Be the first to share your thoughts!