ScholarLoop Studio · 评委级可信检索
可信论文检索工作台
把 6.4 万篇语料、公开基准优势和逐句证据核验压进一个可演示的可信检索作品。 实时·非确定性·非 verified 承重
0证据伪造数
64,183文献语料规模
2/2公开基准均优于 BM25
默认离线证据零伪造关系图稳定可复现点证据即看原文
怎么用
先看已验证基准结果,再点证据字段看原文高亮;也可以输入任意研究问题体验实时检索。
先看已验证基准结果,再点证据字段看原文高亮;也可以输入任意研究问题体验实时检索。
信任叙事
每个核心结论都能回到公开基准、原文片段或已核验外部来源;不确定就标注待核验。
每个核心结论都能回到公开基准、原文片段或已核验外部来源;不确定就标注待核验。
为什么可信
公开基准、原文高亮、外部元数据缓存三路互相校验。
公开基准、原文高亮、外部元数据缓存三路互相校验。
Realtime results are not verified load-bearing evidence. Failed calls return an explicit empty fallback.
1 · 输入任意问题,现场检索文献
输入研究问题后,系统实时拆解意图并在 6.4 万篇文献中给出排序推荐;服务不可用时诚实留空,绝不补造结果。
尚未运行实时搜索。禁用、超时或 LLM 不可用时会显示明确回退。
不可用时不编造推荐。
不可用时不编造推荐。
2 · 已验证结果与证据卡
这里展示公开基准与证据卡的承重结果:指标不重算、不改写,证据字段可逐句核验。
0.1312LitSearch A-v2 F1
verified public benchmark
verified public benchmark
0.0964LitSearch BM25 F1
baseline for comparison
baseline for comparison
0.1972RSQ resolvable A-v2 F1
second public benchmark
second public benchmark
50.0000Gap candidates
research-gap candidates
research-gap candidates
Are there any research papers on methods to compress large-scale language models using task-agnostic knowledge distillation techniques?
点击任意证据字段,右侧会高亮原文中支撑它的那一句;对不上的字段会明确标注待核验。
2. An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Modelspaper 258212842
3. XtremeDistil: Multi-stage Distillation for Massive Multilingual Modelspaper 218502458
3 · 系统如何做出这次推荐
用评委可读的方式展示查询拆解、排序、证据接地与边界说明;原始证据留在可展开附录中。
1. 理解研究问题
把原始问题拆成可检索的研究主题;主画面不重新调用模型。
检索排序结果逐字段证据卡fabricated=0
查看原始证据
reports\m040\results.jsonreports\m020\evidence\litsearch_000.json
[ "large language model compression methods", "knowledge distillation for language models", "task-agnostic knowledge distillation" ]
2. 在语料中排序候选论文
展示已经冻结的排序、命中信息与推荐理由;不新增指标、不重算结果。
检索排序结果fabricated=0
查看原始证据
reports\m040\results.json
{
"system": "scholarloop_a_v2",
"metrics": {
"P@10": 0.0,
"R@20": 0.0,
"F1": 0.0,
"NDCG@20": 0.0
},
"top_rows": [
{
"rank": 1,
"corpusid": 258212842,
"relation_label": "部分相关展示位(有证据卡;非官方 gold 命中)",
"in_gold": false,
"has_evidence_card": true,
"score": 0.9228804111480713,
"reason": "bm25=0.782*0.10; dense_v2=1.000*0.40; sub_bm25=0.806*0.15; sub_dense_v2=0.825*0.15; cross_encoder=1.000*0.20",
"source_path": "reports\\m040\\results.json",
"source_json_pointer": "per_query[litsearch_000].scholarloop_a_v2.ranked_top20[0]"
},
{
"rank": 2,
"corpusid": 218502458,
"relation_label": "部分相关展示位(有证据卡;非官方 gold 命中)",
"in_gold": false,
"has_evidence_card": true,
"score": 0.8849339485168457,
"reason": "bm25=0.888*0.10; dense_v2=0.906*0.40; sub_bm25=0.804*0.15; sub_dense_v2=0.850*0.15; cross_encoder=0.927*0.20",
"source_path": "reports\\m040\\results.json",
"source_json_pointer": "per_query[litsearch_000].scholarloop_a_v2.ranked_top20[1]"
},
{
"rank": 3,
"corpusid": 257038997,
"relation_label": "未命中 gold;不补写相关性",
"in_gold": fals
...3. 把推荐落到原文证据
每个字段都可点击核验;能定位原文就高亮,定位不到就保持待核验。
逐字段证据卡逐字段证据卡fabricated=0
查看原始证据
reports\m020\evidence\litsearch_000.jsonreports\m020\evidence
{
"card_count": 3,
"matrix_rows": 3,
"status_counts": {
"已有证据支持": 22,
"需人工核验": 6,
"存在争议": 2
}
}4. 解释研究空白候选
研究空白只作为启发式展示,并明确保留边界,不把候选启发包装成独立预测能力。
研究空白展示频率消融边界主张一致性边界fabricated=0
查看原始证据
reports\m070\gaps_display.jsonreports\m100\gap_frequency_ablation.jsonreports\m110\consistency_scan.json
{
"gap_items": 50,
"graph_nodes": 25,
"graph_edges": 50,
"m100_frequency_boundary": {
"conclusion": "frequency_is_primary_driver_or_signal_absent",
"claim_boundary": "频率配平后空白预测信号减弱或消失;创新主张必须收紧为频率驱动下的候选生成启发。",
"frequency_matched_delta": -0.198
}
}