Telegram搜索机器人的数据来源有哪些?
2 个回答
Telegram搜索机器人主要通过两种途径获取数据:
1. 官方提供的公开的API接口。一些搜索群组、频道之类的最基本的功能,官方有公开的API接口供开发者调用。机器人的很多底层功能都是调用官方的API实现的。
2. 非官方的抓取渠道。机器人会通过爬虫技术抓取公开信息,比如网页端或客户端抓取群组、频道的公开信息。
在实际使用中可能混合使用不同机器人的数据源。官方API数据更加稳定可靠,非官方抓取数据更新更快但可能不准确。
对于新手来说,建议首先选择用户基数大、口碑好的机器人,这种机器人的研发团队会更加正规,其数据来源也会更加可靠。
Telegram机器人搜索群组及频道的数据来源主要分为两类:
1. 官方API接口
官方的Bot API能获取到基础的公开数据(例如通过用户名查询聊天),但权限有限,无法获取到隐私群组或大量的敏感数据。
2. 数据库抓取+用户提交
许多机器人使用第三方数据库(如 TgCatalog、GroupsList 等)进行数据存储。这些第三方数据库的数据主要来源于长期的爬取与用户投稿。此外,还有一些机器人会让用户主动提供群数据。
3. 用户授权
如果你授权机器人访问你的账号,那么机器人可以查看你所加入过的群组,但是不能够获得其他人信息。
现在没有哪个机器人能够做到100%覆盖,都是拼拼凑凑的数据。建议谨慎授权机器人隐私权限,避免添加可疑机器人。