ScholarLoop Studio · 评委级可信检索

可信论文检索工作台

把 6.4 万篇语料、公开基准优势和逐句证据核验压进一个可演示的可信检索作品。 实时·非确定性·非 verified 承重

0证据伪造数
64,183文献语料规模
2/2公开基准均优于 BM25
默认离线证据零伪造关系图稳定可复现点证据即看原文
怎么用
先看已验证基准结果,再点证据字段看原文高亮;也可以输入任意研究问题体验实时检索。
信任叙事
每个核心结论都能回到公开基准、原文片段或已核验外部来源;不确定就标注待核验。
为什么可信
公开基准、原文高亮、外部元数据缓存三路互相校验。

Realtime results are not verified load-bearing evidence. Failed calls return an explicit empty fallback.

1 · 输入任意问题,现场检索文献

输入研究问题后,系统实时拆解意图并在 6.4 万篇文献中给出排序推荐;服务不可用时诚实留空,绝不补造结果。

尚未运行实时搜索。禁用、超时或 LLM 不可用时会显示明确回退。
不可用时不编造推荐。

2 · 已验证结果与证据卡

这里展示公开基准与证据卡的承重结果:指标不重算、不改写,证据字段可逐句核验。

0.1312LitSearch A-v2 F1
verified public benchmark
0.0964LitSearch BM25 F1
baseline for comparison
0.1972RSQ resolvable A-v2 F1
second public benchmark
50.0000Gap candidates
research-gap candidates

Are there any research papers on methods to compress large-scale language models using task-agnostic knowledge distillation techniques?

点击任意证据字段,右侧会高亮原文中支撑它的那一句;对不上的字段会明确标注待核验。

1. Contrastive Distillation on Intermediate Representations for Language Model Compressionpaper 221995575

2. An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Modelspaper 258212842

3. XtremeDistil: Multi-stage Distillation for Massive Multilingual Modelspaper 218502458

3 · 系统如何做出这次推荐

用评委可读的方式展示查询拆解、排序、证据接地与边界说明;原始证据留在可展开附录中。

1. 理解研究问题

把原始问题拆成可检索的研究主题;主画面不重新调用模型。

检索排序结果逐字段证据卡fabricated=0
large language model compression methodsknowledge distillation for language modelstask-agnostic knowledge distillation
查看原始证据
reports\m040\results.jsonreports\m020\evidence\litsearch_000.json
[
  "large language model compression methods",
  "knowledge distillation for language models",
  "task-agnostic knowledge distillation"
]

2. 在语料中排序候选论文

展示已经冻结的排序、命中信息与推荐理由;不新增指标、不重算结果。

检索排序结果fabricated=0
#1 · paper 258212842#2 · paper 218502458#3 · paper 257038997#4 · paper 201670719#5 · paper 258461336
查看原始证据
reports\m040\results.json
{
  "system": "scholarloop_a_v2",
  "metrics": {
    "P@10": 0.0,
    "R@20": 0.0,
    "F1": 0.0,
    "NDCG@20": 0.0
  },
  "top_rows": [
    {
      "rank": 1,
      "corpusid": 258212842,
      "relation_label": "部分相关展示位(有证据卡;非官方 gold 命中)",
      "in_gold": false,
      "has_evidence_card": true,
      "score": 0.9228804111480713,
      "reason": "bm25=0.782*0.10; dense_v2=1.000*0.40; sub_bm25=0.806*0.15; sub_dense_v2=0.825*0.15; cross_encoder=1.000*0.20",
      "source_path": "reports\\m040\\results.json",
      "source_json_pointer": "per_query[litsearch_000].scholarloop_a_v2.ranked_top20[0]"
    },
    {
      "rank": 2,
      "corpusid": 218502458,
      "relation_label": "部分相关展示位(有证据卡;非官方 gold 命中)",
      "in_gold": false,
      "has_evidence_card": true,
      "score": 0.8849339485168457,
      "reason": "bm25=0.888*0.10; dense_v2=0.906*0.40; sub_bm25=0.804*0.15; sub_dense_v2=0.850*0.15; cross_encoder=0.927*0.20",
      "source_path": "reports\\m040\\results.json",
      "source_json_pointer": "per_query[litsearch_000].scholarloop_a_v2.ranked_top20[1]"
    },
    {
      "rank": 3,
      "corpusid": 257038997,
      "relation_label": "未命中 gold;不补写相关性",
      "in_gold": fals
...

3. 把推荐落到原文证据

每个字段都可点击核验;能定位原文就高亮,定位不到就保持待核验。

逐字段证据卡逐字段证据卡fabricated=0
已有证据支持: 22需人工核验: 6存在争议: 2
查看原始证据
reports\m020\evidence\litsearch_000.jsonreports\m020\evidence
{
  "card_count": 3,
  "matrix_rows": 3,
  "status_counts": {
    "已有证据支持": 22,
    "需人工核验": 6,
    "存在争议": 2
  }
}

4. 解释研究空白候选

研究空白只作为启发式展示,并明确保留边界,不把候选启发包装成独立预测能力。

研究空白展示频率消融边界主张一致性边界fabricated=0
gap candidates: 50concepts: 25relations: 50
查看原始证据
reports\m070\gaps_display.jsonreports\m100\gap_frequency_ablation.jsonreports\m110\consistency_scan.json
{
  "gap_items": 50,
  "graph_nodes": 25,
  "graph_edges": 50,
  "m100_frequency_boundary": {
    "conclusion": "frequency_is_primary_driver_or_signal_absent",
    "claim_boundary": "频率配平后空白预测信号减弱或消失;创新主张必须收紧为频率驱动下的候选生成启发。",
    "frequency_matched_delta": -0.198
  }
}