ScholarLoop Studio · 评委级可信检索

可信论文检索工作台

把 6.4 万篇语料、公开基准优势和逐句证据核验压进一个可演示的可信检索作品。 实时·非确定性·非 verified 承重

0证据伪造数

64,183文献语料规模

2/2公开基准均优于 BM25

默认离线证据零伪造关系图稳定可复现点证据即看原文

怎么用
先看已验证基准结果，再点证据字段看原文高亮；也可以输入任意研究问题体验实时检索。

信任叙事
每个核心结论都能回到公开基准、原文片段或已核验外部来源；不确定就标注待核验。

为什么可信
公开基准、原文高亮、外部元数据缓存三路互相校验。

输入任意研究问题
可选实时路径；不可用时只显示诚实空态，不编造推荐。

Realtime results are not verified load-bearing evidence. Failed calls return an explicit empty fallback.

1 · 输入任意问题，现场检索文献

输入研究问题后，系统实时拆解意图并在 6.4 万篇文献中给出排序推荐；服务不可用时诚实留空，绝不补造结果。

尚未运行实时搜索。禁用、超时或 LLM 不可用时会显示明确回退。
不可用时不编造推荐。

2 · 已验证结果与证据卡

这里展示公开基准与证据卡的承重结果：指标不重算、不改写，证据字段可逐句核验。

0.1312LitSearch A-v2 F1
verified public benchmark

0.0964LitSearch BM25 F1
baseline for comparison

0.1972RSQ resolvable A-v2 F1
second public benchmark

50.0000Gap candidates
research-gap candidates

基准查询

Are there any research papers on methods to compress large-scale language models using task-agnostic knowledge distillation techniques?

点击任意证据字段，右侧会高亮原文中支撑它的那一句；对不上的字段会明确标注待核验。

1. Contrastive Distillation on Intermediate Representations for Language Model Compressionpaper 221995575

2. An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Modelspaper 258212842

3. XtremeDistil: Multi-stage Distillation for Massive Multilingual Modelspaper 218502458

3 · 系统如何做出这次推荐

用评委可读的方式展示查询拆解、排序、证据接地与边界说明；原始证据留在可展开附录中。

1. 理解研究问题

把原始问题拆成可检索的研究主题；主画面不重新调用模型。

检索排序结果逐字段证据卡fabricated=0

查看原始证据

reports\m040\results.jsonreports\m020\evidence\litsearch_000.json

[
  "large language model compression methods",
  "knowledge distillation for language models",
  "task-agnostic knowledge distillation"
]

2. 在语料中排序候选论文

展示已经冻结的排序、命中信息与推荐理由；不新增指标、不重算结果。

检索排序结果fabricated=0

查看原始证据

reports\m040\results.json

{
  "system": "scholarloop_a_v2",
  "metrics": {
    "P@10": 0.0,
    "R@20": 0.0,
    "F1": 0.0,
    "NDCG@20": 0.0
  },
  "top_rows": [
    {
      "rank": 1,
      "corpusid": 258212842,
      "relation_label": "部分相关展示位（有证据卡；非官方 gold 命中）",
      "in_gold": false,
      "has_evidence_card": true,
      "score": 0.9228804111480713,
      "reason": "bm25=0.782*0.10; dense_v2=1.000*0.40; sub_bm25=0.806*0.15; sub_dense_v2=0.825*0.15; cross_encoder=1.000*0.20",
      "source_path": "reports\\m040\\results.json",
      "source_json_pointer": "per_query[litsearch_000].scholarloop_a_v2.ranked_top20[0]"
    },
    {
      "rank": 2,
      "corpusid": 218502458,
      "relation_label": "部分相关展示位（有证据卡；非官方 gold 命中）",
      "in_gold": false,
      "has_evidence_card": true,
      "score": 0.8849339485168457,
      "reason": "bm25=0.888*0.10; dense_v2=0.906*0.40; sub_bm25=0.804*0.15; sub_dense_v2=0.850*0.15; cross_encoder=0.927*0.20",
      "source_path": "reports\\m040\\results.json",
      "source_json_pointer": "per_query[litsearch_000].scholarloop_a_v2.ranked_top20[1]"
    },
    {
      "rank": 3,
      "corpusid": 257038997,
      "relation_label": "未命中 gold；不补写相关性",
      "in_gold": fals
...

3. 把推荐落到原文证据

每个字段都可点击核验；能定位原文就高亮，定位不到就保持待核验。

逐字段证据卡逐字段证据卡fabricated=0

查看原始证据

reports\m020\evidence\litsearch_000.jsonreports\m020\evidence

{
  "card_count": 3,
  "matrix_rows": 3,
  "status_counts": {
    "已有证据支持": 22,
    "需人工核验": 6,
    "存在争议": 2
  }
}

4. 解释研究空白候选

研究空白只作为启发式展示，并明确保留边界，不把候选启发包装成独立预测能力。

研究空白展示频率消融边界主张一致性边界fabricated=0

查看原始证据

reports\m070\gaps_display.jsonreports\m100\gap_frequency_ablation.jsonreports\m110\consistency_scan.json

{
  "gap_items": 50,
  "graph_nodes": 25,
  "graph_edges": 50,
  "m100_frequency_boundary": {
    "conclusion": "frequency_is_primary_driver_or_signal_absent",
    "claim_boundary": "频率配平后空白预测信号减弱或消失；创新主张必须收紧为频率驱动下的候选生成启发。",
    "frequency_matched_delta": -0.198
  }
}