🧪 Skills
Prospector
根据关键词自动搜索潜在客户公司,提取联系方式(邮箱),输出结构化客户列表。 适用场景: - 用户需要寻找潜在客户时 - 用户需要获取公司联系方
v1.0.0
Description
name: prospector description: | 根据关键词自动搜索潜在客户公司,提取联系方式(邮箱),输出结构化客户列表。
适用场景:
- 用户需要寻找潜在客户时
- 用户需要获取公司联系方式时
- 用户提到"找客户"、"获客"、"销售线索"、"潜在客户"等关键词
- 用户需要查询已收集的客户数据
功能:
- 根据关键词和地区搜索潜在客户公司
- 访问公司官网提取邮箱地址
- 通过WHOIS查询域名注册邮箱
- 验证邮箱格式有效性
- 输出结构化的客户列表(JSON/CSV格式)
- 自动缓存结果,避免重复搜索
- 自动排重,跳过已存在的公司
- 查询已收集的客户数据(简单查询)
注意:此Skill只负责"找客户"和"简单查询",不负责"发邮件"和"客户管理"。发送邮件请使用其他邮件相关Skill,复杂客户管理请使用专门的客户管理工具。
user-invocable: true metadata: openclaw: emoji: "⛏️" requires: bins: ["python3", "curl"] install: - id: pip kind: pip package: requests,beautifulsoup4,python-whois,dnspython label: "Install Python dependencies"
Prospector - 潜在客户挖掘器
快速开始
用户只需描述目标客户,即可自动搜索并提取联系方式:
用户:帮我找上海地区的软件外包公司
用户:搜索北京的人工智能企业,需要50家
用户:找一些外贸公司,规模大一点的
用户:继续找更多软件公司(翻页搜索)
用户:查看已收集的客户列表
用户:搜索包含"阿里"的客户
工作流程
找客户流程
Step 1: 解析需求
- 提取关键词:行业、产品、服务类型
- 提取地区:城市、省份、国家
- 提取数量:需要多少家
Step 2: 检查缓存
- 检查是否有相同关键词的缓存结果
- 缓存有效期:7天
- 如果有缓存,直接返回,避免重复搜索
Step 3: 搜索公司
- 调用 scripts/search_companies.py
- 使用多搜索引擎:Google、DuckDuckGo、Bing、百度、Searx
- 支持代理访问(Google等需要代理)
- 返回公司名称、域名、简介
Step 4: 排重处理
- 检查公司是否已存在于数据库
- 跳过已处理的公司
- 只处理新公司
Step 5: 提取邮箱
- 调用 scripts/extract_emails.py
- 爬取官网页面提取邮箱
- WHOIS查询域名注册信息
- 缓存邮箱结果
Step 6: 输出结果
- 结构化JSON格式
- 可选CSV导出
- 统计汇总信息
查询客户流程
Step 1: 解析查询意图
- 列表查询:列出已收集的客户
- 关键词搜索:按公司名搜索
- 邮箱搜索:按邮箱关键词搜索
- 统计查询:查看数据统计
Step 2: 从缓存读取
- 从本地缓存读取客户数据
- 支持多种筛选条件
Step 3: 返回结果
- 表格或JSON格式
- 支持导出
使用示例
找客户示例
示例1:首次搜索
用户:帮我找10家上海的SaaS公司
执行:
1. 搜索 "上海 SaaS公司"
2. 提取邮箱
3. 缓存结果
4. 返回结果
输出:
📊 搜索结果
━━━━━━━━━━━━━━━━━━━━━━━━━━
✅ 找到公司:10家
✅ 有效邮箱:7个
📈 累计数据:
总公司数:10
总邮箱数:7
示例2:再次搜索相同关键词
用户:帮我找上海的SaaS公司
执行:
1. 检查缓存 → 发现缓存
2. 使用缓存结果
3. 跳过已存在的公司
输出:
📦 使用缓存结果 (10 家公司)
⏭️ 跳过 10 家已存在的公司
✅ 待处理 0 家公司
示例3:翻页搜索更多
用户:继续找更多上海的SaaS公司
执行:
1. 翻页偏移:跳过前10条
2. 搜索新的结果
3. 跳过已存在的公司
4. 返回新公司
输出:
🔍 搜索: 上海 SaaS公司
翻页偏移: 10
⏭️ 跳过 3 家已存在的公司
✅ 待处理 7 家公司
查询客户示例
示例4:列出所有客户
用户:查看已收集的客户列表
执行:
python scripts/query_customers.py list --limit 20
输出:
📋 客户列表 (共 50 家)
序号 公司名称 域名 邮箱
────────────────────────────────────────────────────────────────────────────────────────
1 XX科技有限公司 xx.com contact@xx.com, sales@xx.com
2 YY信息技术有限公司 yy.com info@yy.com
...
示例5:按关键词搜索客户
用户:搜索包含"阿里"的客户
执行:
python scripts/query_customers.py search "阿里"
输出:
🔍 搜索结果: 阿里 (共 3 家)
• 阿里巴巴科技有限公司
邮箱: contact@alibaba.com
• 阿里云智能有限公司
邮箱: support@aliyun.com
示例6:按邮箱搜索
用户:查找包含"sales"的邮箱
执行:
python scripts/query_customers.py email sales
输出:
📧 邮箱搜索: sales (共 15 家)
• XX科技有限公司
匹配: sales@xx.com
示例7:查看数据统计
用户:查看已收集的客户数据统计
执行:
python scripts/query_customers.py stats
输出:
📊 数据统计
========================================
总公司数: 50
总邮箱数: 35
搜索次数: 5
有邮箱公司: 30
邮箱覆盖率: 60.0%
示例8:导出数据
用户:导出所有客户数据
执行:
python scripts/query_customers.py export --output customers.json --csv customers.csv
输出:
✅ 已导出 50 条数据到 customers.json
✅ 已导出 50 条数据到 customers.csv
缓存机制
缓存内容
- 搜索结果缓存(按关键词+地区)
- 公司信息缓存(按域名)
- 邮箱缓存(按域名)
缓存有效期
- 搜索缓存:7天
- 公司信息:永久
- 邮箱信息:永久
缓存位置
AutoFindCustomer/
└── cache/
├── companies.json # 公司数据库
├── searches.json # 搜索缓存
└── emails.json # 邮箱缓存
命令行参数
找客户命令
# 基本搜索
python scripts/find_customers.py "软件开发" --region "上海" --limit 20
# 不使用缓存
python scripts/find_customers.py "软件开发" --no-cache
# 不跳过已存在的公司
python scripts/find_customers.py "软件开发" --no-skip
# 翻页搜索(获取更多不同结果)
python scripts/find_customers.py "软件开发" --page 10
# 查看缓存统计
python scripts/find_customers.py --stats
# 导出结果
python scripts/find_customers.py "软件开发" --output results.json --csv results.csv
查询客户命令
# 列出客户
python scripts/query_customers.py list --limit 20
# 只显示有邮箱的客户
python scripts/query_customers.py list --has-email
# 只显示无邮箱的客户
python scripts/query_customers.py list --no-email
# JSON格式输出
python scripts/query_customers.py list --json
# 按关键词搜索
python scripts/query_customers.py search "关键词" --region "上海"
# 按邮箱搜索
python scripts/query_customers.py email "sales"
# 查看统计
python scripts/query_customers.py stats
# 导出数据
python scripts/query_customers.py export --output export.json --csv export.csv
输出格式
JSON格式
{
"query": "上海 软件公司",
"total_companies": 50,
"total_emails": 35,
"email_coverage": "70.0%",
"results": [
{
"name": "XX科技有限公司",
"domain": "xx.com",
"url": "https://xx.com",
"emails": ["contact@xx.com", "sales@xx.com"],
"description": "专业软件开发服务"
}
]
}
CSV格式
公司名称,域名,邮箱,网址,简介
XX科技有限公司,xx.com,contact@xx.com,https://xx.com,专业软件开发服务
YY信息技术有限公司,yy.com,sales@yy.com,https://yy.com,IT解决方案
职责边界
✅ 负责
- 搜索潜在客户
- 提取联系方式
- 验证邮箱格式
- 简单查询客户数据
- 导出客户数据
- 数据统计
❌ 不负责
- 发送邮件(由其他Skill处理)
- 复杂客户管理(标签、分类、跟进状态)
- 客户备注记录
- 发送历史追踪
- 回复状态管理
与其他Skill配合
找到客户后,可以使用其他Skill进行后续操作:
用户:帮我找上海的外贸公司,然后给每家公司发一封开发信
Agent会:
1. 调用 auto-find-customer Skill 找客户
2. 调用 send-email Skill 发邮件
复杂客户管理建议使用专门的CRM工具或独立的customer-manager Skill。
注意事项
- 搜索速度受网络影响,建议控制并发
- 部分网站可能无法访问,会自动跳过
- 邮箱提取成功率约60-70%
- 建议搜索后人工复核关键客户
- 缓存数据会累积,形成客户资产
- 使用 --page 参数可以获取更多不同结果
- 简单查询功能在此Skill内,复杂管理建议使用CRM系统
搜索引擎说明
支持的搜索引擎
| 引擎 | 代理需求 | 地区限制 | 说明 |
|---|---|---|---|
| ✅ 需要 | 中国、伊朗、朝鲜、俄罗斯 | 结果质量最高 | |
| DuckDuckGo | ❌ 无需 | 无 | 推荐使用 |
| Bing | ❌ 无需 | 中国 | 结果质量较好 |
| 百度 | ❌ 无需 | 无 | 适合中文搜索 |
| Searx | ❌ 无需 | 无 | 开源元搜索引擎 |
代理设置
如果用户在中国大陆等需要代理的地区,需要设置代理:
# 环境变量方式
export HTTPS_PROXY=http://127.0.0.1:7890
export HTTP_PROXY=http://127.0.0.1:7890
# 或命令行参数
python scripts/search_companies.py "software company" --proxy http://127.0.0.1:7890
地区推荐
- 中国大陆:使用百度、DuckDuckGo、Searx(无需代理)
- 海外:可使用所有搜索引擎,Google 效果最佳
- 俄罗斯:使用 DuckDuckGo、Bing、Searx(Google 被屏蔽)
Reviews (0)
Sign in to write a review.
No reviews yet. Be the first to review!
Comments (0)
No comments yet. Be the first to share your thoughts!