多维 Data Layer
单维度数据的问题
现有的每个加密货币情报平台都只能看到市场的一个切面。Kaito 看到新闻,Nansen 看到链上数据,Hyperliquid 看到自己的订单流,Polymarket 看到预测赔率。
它们都无法回答那个真正重要的问题:"这个信号是真的吗?哪个市场还没有将其定价?"
要回答这个问题,需要同时观察多个市场。
三个维度,一个视图
Roma 从三个通常完全割裂的维度接入实时数据:
| 维度 | 看到什么 | 关键数据 |
|---|---|---|
| Roma News | 正在发生什么 | 30+ 来源:媒体、KOL、政策、链上数据、社区 |
| Roma Predict | 谁最先知道 | Polymarket 赔率、聪明钱流向、内幕活动 |
| Roma Perp | 机会在哪里 | Hyperliquid 价格、资金费率、OI、清算地图 |
交叉验证实战
示例:SEC 批准 ETH ETF
当这一事件发生时,每个维度看到的东西不同:
Roma News 检测到:
- SEC 官方 RSS 推送新文件
- CoinDesk 发布突发新闻
- 3 位 Tier-1 KOL 同时发帖
- 置信度:95%
Roma Predict 检测到:
- Polymarket "ETH ETF Approved" 赔率从 45% 跳升至 92%
- 3 个被标记的聪明钱钱包在跳升前 2 分钟买入 Yes
- 总持仓:$480K
Roma Perp 检查:
- ETH-PERP 价格:无变动
- 资金费率:正常范围
- 未平仓量:无变化
判定
任何单一维度都是不完整的:
- 仅看新闻: 你知道发生了什么,但它是真的还是谣言?无从验证。
- 仅看预测市场: 赔率变了,但你该交易哪个资产?没有答案。
- 仅看合约: 价格没动,但你不知道刚发生了重大事件。
三者结合: 事件是真实的(新闻确认),聪明钱已经验证了(预测市场确认),而合约市场尚未反应(机会确认)。
反例:过滤虚假信号
一位 Tier-2 KOL 发推:"SEC 即将批准 SOL ETF。"
- Roma News: 检测到推文,重要性评分 72/100
- Roma Predict: Polymarket "SOL ETF" 赔率——无变化,停留在 12%。聪明钱钱包——零活动。
- 判定: 信号被过滤为未验证谣言。不生成交易信号。
没有预测市场的交叉验证,这条推文可能触发一笔错误交易。过滤噪音的能力与检测信号的能力同样宝贵。
数据源覆盖
新闻与情绪(Roma News)
| 类别 | 来源 |
|---|---|
| 链上 | GMGN 信号、巨鲸警报、DeFiLlama、OKX 聪明钱、Binance 上币 |
| 媒体 | CoinDesk、TheBlock、OKX 情绪、中文财经媒体 |
| KOL | Twitter Tier-1/2/3 监控、推文聚合 |
| 财经 | 华尔街见闻、财联社、Yahoo Finance |
| 社区 | Reddit、Twitter 趋势、微博、Binance Square、Discord |
| 政策 | SEC、CFTC、Fed RSS、白宫、Truth Social |
永续合约(Roma Perp)
| 数据 | 更新频率 |
|---|---|
| 标记价 / 最新价 | 实时 WebSocket |
| 资金费率 | 实时 + 历史 |
| 未平仓量 | 实时 + 历史 |
| 清算数据 | 实时 |
| 订单簿深度 | 实时 WebSocket |
| 交易员排行榜 | 准实时 |
预测市场(Roma Predict)
| 数据 | 更新频率 |
|---|---|
| 事件赔率(Yes/No) | 实时 |
| 赔率历史 | 持续 |
| 聪明钱钱包 | 追踪 + 画像 |
| 大额交易(>$10K) | 实时提醒 |
| 内幕活动检测 | 算法驱动,准实时 |
| 新市场创建 | 监控中 |
为什么这是护城河
数据层随时间以两种方式产生复合效应:
- 规模效应: 更多来源、更多已处理事件、更多标注训练数据输入 Inference Engine
- 跨市场校准: 每一个事件-结果对都在三个维度上校准 Probability Graph——这种校准需要三条数据流同时存在
竞争对手可以复制任何单一维度。但要同时复制所有三个维度,加上交叉验证逻辑和历史校准数据,需要构建三个独立的生产系统并运行足够长的时间来积累有意义的数据。