loading

Loading

请输入关键字开始搜索
    首页 AI专栏提示词

    提示词维度测试仪

    分类:提示词
    字数: (740)
    阅读: (88)
    0

    提示词维度测试仪

    背景

    当我们使用大模型对ASR(语音识别)文本进行总结时,如何判断总结质量的好坏?这里提供一个简单的测试框架。

    核心测试维度

    1. 完整性 ✅

    原文的关键信息是否都被覆盖?

    检查项 说明
    核心观点 主要论点是否保留
    关键数据 重要数字、时间是否准确
    人物/事件 关键角色是否提及

    2. 准确性 🎯

    总结内容是否与原文一致?

    检查项 说明
    事实正确 没有张冠李戴
    无幻觉 没有凭空编造内容
    语义保真 没有曲解原意

    3. 简洁性 📝

    是否做到了有效压缩?

    检查项 说明
    去除冗余 口语化内容已精简
    结构清晰 层次分明,易于阅读
    长度合理 压缩比适当(通常10%-30%)

    4. 可读性 👀

    总结文本是否流畅易懂?

    检查项 说明
    语句通顺 没有病句、断句
    逻辑连贯 上下文衔接自然
    专业术语 保留必要术语,通俗化表达

    快速打分表

    维度 权重 得分(1-5) 加权分
    完整性 30% _ _
    准确性 40% _ _
    简洁性 15% _ _
    可读性 15% _ _
    总分 100% - _

    💡 评分参考:4分以上为优秀,3-4分为合格,3分以下需要优化提示词

    常见问题与优化方向

    问题 可能原因 优化建议
    遗漏关键点 提示词太笼统 明确要求"保留所有核心观点"
    出现幻觉 模型自由发挥 添加"不要编造原文没有的内容"
    过于冗长 未限制长度 指定字数或压缩比例
    逻辑混乱 缺少结构引导 要求"按时间/主题分点总结"
    本文发布于2025年11月27日09:59,已经过了32天,若内容或图片失效,请留言反馈
    文章出处: 求索空间
    文章链接: https://blog.askerlab.com/prompt_test
    评论列表:
    empty

    暂无评论