【问卷猩】基于 ERNIE Bot 和 LLM2Json 的问卷生成器

项目背景

众所周知,JSON是目前广泛使用的数据交互格式之一,当大模型能够稳定输出Json格式的数据之后,我们就可以拿输出的数据与前端、数据库、操作系统、物联网终端设备等等实现很多交互的行为动作,从而做出更好玩更有价值的大模型原生应用。

本项目以⚡问卷生成⚡任务为例,演示如何控制ERNIE Bot的格式化输出,并将输出结果与前端交互,实现从Prompts直接生成问卷网页的效果。

难点分析

本项目的难点主要在于多层嵌套数据结构体的控制生成。

  • 单层数据结构:
    单层数据结构是类似于{key: value, key: value, …}这样只有一层键值对关系的,相对来说比较简单,生成可控度高,不容易出错。
{
	"address": "北京市朝阳区XXX路XXX号",
	"date": "2023-06-25",
	"email": "zhangsan@example.com",
	"idcode": "110101199003077777",
	"name": "张三",
	"phone": "13800000000",
	"sex": "男"
}
  • 多层嵌套数据结构:
    多层嵌套数据是比较复杂的数据结构,如下例子所示,在address的第一层级下,嵌套了第二层级的cityarearoaddetail字段,在真实业务场景中,数据结构体往往是多层级嵌套,字段多,嵌套关系也比较复杂,因此该类数据结构体生成的难度比较大,容易出现一些纰漏导致数据解析不正确而报错。
{
	"address": {
		"city": "北京市",
		"area": "朝阳区",
		"road": "XXX路",
		"detail": "XXX号"
	},
	"date": "2023-06-25",
	"email": {
    	"common": "zhangsan@example.com",
        "backup": "zhangsan@example1.com"
    },
	"idcode": "110101199003077777",
	"name": "张三",
	"phone": "13800000000",
	"sex": "男"
}

本项目的问卷生成任务,本质上就是生成一个多层嵌套数据结构体的数据,下面开始给大家演示和解析代码。

开始上手

1. 安装依赖

In [ ]

!pip install erniebot --upgrade
!pip install llm2json

2. 配置ERNIE Bot

⚠ 注意:请配置ERNIE Bot的access_token,否则将无法继续运行。

In [2]

import erniebot

erniebot.api_type = "aistudio"
erniebot.access_token = "xxxxxxxxxxxxxxxxxxx"

def ernieChat(content):
    response = erniebot.ChatCompletion.create(model="ernie-4.0", 
    messages=[{"role": "user", "content": content}])
    return response.get_result()

3. 定义数据结构

我们需要做好数据结构体的定义,一份问卷的生成结构至少有两层。

  • 第一层WenJuantitle(问卷标题)、description(问卷描述)和最核心的data(问题列表)结构体。
  • 第二层是对data嵌套数据的定义,在data下面有若干个问题和选项,并且问题类型有单选题、多选题、填空题等等,因此这里需要针对问题定义一个新的对象Question,第一个键是types,用于确定问题类型,它是整数型的数据(1为单选,2为多选,3为填空);第二个是question,定义问题;第三个是choices问题对应的选项内容,数据类型是列表list。

In [ ]

from typing import List
from llm2json.prompts.schema import BaseModel, Field


class Question(BaseModel):
    types: int = Field(description = "问题类型,1为单选,2为多选,3为填空")
    question: str = Field(description = "问题内容")
    choices: List[str] = Field(description = "选项内容")

class WenJuan(BaseModel):
    title: str = Field(description = "问卷标题")
    description: str = Field(description = "问卷描述")
    data: List[Question] = Field(description = "问题列表")

4. 定义正例

定义完数据结构之后,我们其实可以直接执行了。但因为多层嵌套的数据结构体比较复杂,因此我们最好给LLMs一个正确示例,让LLMs生成的输出结果更加完美和稳定。

In [6]

correct_example = '''
    {
        "title": "问卷标题",
        "description": "问卷描述",
        "data":[
            {
                "types": 1,
                "question": "问题(单选)"
                "choices": ["选项1", "选项2", "选项3"]
            },
            {
                "types": 2,
                "question": "问题(多选)"
                "choices": ["选项1", "选项2", "选项3"]
            },
            {
                "types": 3,
                "question": "问题(填空)"
            },
        ]
    }
'''

5. 定义Prompt任务模板

In [ ]

from llm2json.prompts import Templates

t = Templates(prompt="""
            请你根据主题<{topic}>,设计一份问卷。
            问卷描述需要简单说明该问卷调研的目的。
            问卷题型需包含单选、多选和填空题,对应types分别为1、2、3。
            如果题目类型为填空题,该题不需要返回choices字段。
            出题题型顺序请随机生成。
            题目总数为{num}道题。
            """, 
        field=WenJuan,
        correct_example=correct_example)

6. 测试生成

文心一言用户反馈作为问卷的主题,生成一份包含10道题的问卷。

In [ ]

template = t.invoke(topic="文心一言用户反馈", num="10")
ernieResult = ernieChat(template)

In [10]

from llm2json.output import JSONParser

parser = JSONParser()
result = parser.to_dict(ernieResult)

from pprint import pprint
pprint(result)
{'data': [{'choices': ['18岁以下', '18-25岁', '26-35岁', '36-45岁', '46岁及以上'],
           'question': '您的年龄是?',
           'types': 1},
          {'choices': ['社交媒体', '官方网站', '朋友推荐', '线下活动', '其他'],
           'question': '您通常通过哪些方式了解文心一言的最新动态和产品信息?',
           'types': 2},
          {'question': '请描述您对文心一言产品的整体印象。', 'types': 3},
          {'choices': ['是', '否'], 'question': '您是否使用过文心一言的其他相关产品?', 'types': 1},
          {'choices': ['用户界面', '功能体验', '性能速度', '客户服务', '其他'],
           'question': '您认为文心一言的哪些方面需要改进?',
           'types': 2},
          {'question': '请提供您对文心一言产品的任何建议或意见。', 'types': 3},
          {'choices': ['非常愿意', '比较愿意', '中立', '不太愿意', '非常不愿意'],
           'question': '您是否愿意推荐文心一言产品给您的朋友或家人?',
           'types': 1},
          {'choices': ['价格', '品牌知名度', '用户评价', '功能特点', '客户服务'],
           'question': '以下哪些因素会影响您选择使用文心一言的产品?',
           'types': 2},
          {'choices': ['非常满意', '比较满意', '中立', '不太满意', '非常不满意'],
           'question': '您对文心一言产品的整体满意度如何?',
           'types': 1},
          {'question': '如果您有任何其他问题或需要补充的信息,请在下方留言。', 'types': 3}],
 'description': '这份问卷旨在了解您对文心一言产品的使用体验和满意度,以便我们更好地改进产品和服务。感谢您的参与!',
 'title': '文心一言用户反馈'}

这里我们已经得到了JSON格式的数据,那么我们下面就与前端结合,将数据渲染。前端的核心代码主要是对 问卷类型的判断 ,然后根据问卷类型也就是types的值匹配不同的表单组件。
为了开发方便,前端我用的是Ant Design Vue模板。

<div class="choices">
    <!--单选题-->
    <div v-if="item.types==1">
        <a-radio-group v-model:value="item.choices.keys">
            <a-radio v-for="choice in item.choices" :value="choice">
                {{ choice }}
            </a-radio>
        </a-radio-group>
    </div>
    <!--多选题-->
    <div v-else-if="item.types==2">
        <a-checkbox-group 
            :options="item.choices" />
    </div>
    <!--填空题-->
    <div v-else-if="item.types==3">
        <a-input style="max-width:300px"/>
    </div>
</div>

前端完整源代码见项目目录的frontend.zip压缩包。

7. 服务化部署

在上述程序代码的基础上,我们给后端代码套上Flask引擎,即可完成后端的部署上线。

import json
import erniebot
from typing import List
from llm2json.prompts import Templates
from llm2json.prompts.schema import BaseModel, Field
from llm2json.output import JSONParser
from flask import Flask, request, make_response
from flask_cors import CORS

erniebot.api_type = "aistudio"
erniebot.access_token = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

app = Flask(__name__)
CORS(app, resources={r"/*": {}})

def ernieChat(content):
    response = erniebot.ChatCompletion.create(model="ernie-4.0", 
    messages=[{"role": "user", "content": content}])
    return response.get_result()

class Question(BaseModel):
    question: str = Field(description = "问题内容")
    choices: List[str] = Field(description = "选项内容")

class WenJuan(BaseModel):
    title: str = Field(description = "问卷标题")
    description: str = Field(description = "问卷描述")
    types: int = Field(description = "问题类型,1为单选,2为多选,3为填空")
    data: List[Question] = Field(description = "问题列表")

correct_example = '''
    {
        "title": "问卷标题",
        "description": "问卷描述",
        "data":[
            {
                "types": 1,
                "question": "问题(单选)"
                "choices": ["选项1", "选项2", "选项3"]
            },
            {
                "types": 2,
                "question": "问题(多选)"
                "choices": ["选项1", "选项2", "选项3"]
            },
            {
                "types": 3,
                "question": "问题(填空)"
            },
        ]
    }
'''

def generateQuestionnaire(topic, nums):
    t = Templates(prompt="""
                请你根据主题<{topic}>,设计一份问卷。
                问卷描述需要简单说明该问卷调研的目的。
                问卷题型需包含单选、多选和填空题,对应types分别为1、2、3。
                如果题目类型为填空题,该题不需要返回choices字段。
                出题题型顺序请随机生成。
                题目总数为{num}道题。
                """, 
            field=WenJuan,
            correct_example=correct_example)

    template = t.invoke(topic=topic, num=str(nums))
    ernieResult = ernieChat(template)
    parser = JSONParser()
    result = parser.to_dict(ernieResult)
    return result



@app.route('/')
def index():
    return 'welcome to my webpage!'

@app.route('/generate', methods=['POST'])
def generate():
    topic = request.json.get('topic')
    nums = request.json.get('nums')

    result = generateQuestionnaire(topic, nums)

    return make_response(json.dumps(result), 200)

if __name__=="__main__":
    app.run(port=2024,host="0.0.0.0",debug=True)

后端完整源代码见项目目录的web.py 和 wj.py 代码文件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/751077.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何用亚马逊合作伙伴网络快速上线跨境电商

目前跨境电商已成为行业发展主流&#xff0c;如何快速、低成本打造品牌海外独立站和智能客服营销中心、构建全链路跨境电商体系是出海电商商家都会遇到的难题。亚马逊云科技凭借与亚马逊电商平台易于集成的先天优势成为首选的电商解决方案平台。本文介绍了如何用亚马逊云科技平…

SpringCloud分布式微服务链路追踪方案:Skywalking

一、引言 随着微服务架构的广泛应用&#xff0c;系统的复杂性也随之增加。在这种复杂的系统中&#xff0c;应用通常由多个相互独立的服务组成&#xff0c;每个服务可能分布在不同的主机上。微服务架构虽然提高了系统的灵活性和可扩展性&#xff0c;但也带来了新的挑战&#xf…

深度学习论文撰写实验对比分析时复现其它论文方法的问题

&#x1f4aa; 专业从事且热爱图像处理&#xff0c;图像处理专栏更新如下&#x1f447;&#xff1a; &#x1f4dd;《图像去噪》 &#x1f4dd;《超分辨率重建》 &#x1f4dd;《语义分割》 &#x1f4dd;《风格迁移》 &#x1f4dd;《目标检测》 &#x1f4dd;《暗光增强》 &a…

说一说ABAP CDS View的发展历史与特性

1. 背景 随着SAP Fiori应用程序的兴起&#xff0c;SAP领域的小伙伴接触和使用ABAP CDS View的机会也是越来越多。今天&#xff0c;让我们花些时间&#xff0c;一起在了解下这项技术的设计初衷和发展历史。 2. 设计初衷 说起ABAP CDS View&#xff0c;就不得不提及SAP HANA。…

Open AI限制来袭?用上这个工具轻松破局!

【导语】近日&#xff0c;AI领域掀起了一场不小的波澜。Open AI宣布&#xff0c;从7月9日起&#xff0c;将对部分地区的开发者实施API调用限制。这一消息对于许多依赖Open AI技术的国内初创团队来说&#xff0c;无疑是一个沉重的打击。 对于这些团队而言&#xff0c;Open AI的A…

Arcgis地统计分析工具灰色不可用 解决方法

使用Arcmap&#xff0c;调用地统计分析工具&#xff08;Geostatistical Analyst&#xff09;下的探索数据&#xff08;Explore Data&#xff09;&#xff0c;发现工具呈灰色不可用。这是由于扩展模块中没有将该模块做勾选设置导致的。下面介绍一下如何解决地统计分析工具不可用…

汇聚荣做拼多多运营第一步是什么?

汇聚荣做拼多多运营第一步是什么?在众多电商平台中&#xff0c;拼多多凭借其独特的社交电商模式迅速崛起&#xff0c;吸引了大量消费者和商家的目光。对于希望在拼多多上开店的商家而言&#xff0c;了解如何进行有效运营是成功的关键。那么&#xff0c;汇聚荣做拼多多运营的第…

web前端——HTML

目录 一、HTML概述 1.HTML是什么&#xff1f; 2.HTML具体化解释 二、HTML基本语法 1.声明 2. Head头标签 3.body身体标签 4.一个html的基本结构 5.标签 6.标签属性 ①属性的格式 ②属性的位置 ③添加多个属性 三、基本常用标签 1.超链接 2.图像标签 ①图像标…

C++编程(四)this指针 常函数 常对象 静态成员

文章目录 一、this指针&#xff08;一&#xff09;概念&#xff08;二&#xff09;显式使用this指针的场景1. 当形参和成员变量名一致时2. 返回对象自身的时候必须要使用this指针3. 在类中销毁一个对象 二、常函数和常对象&#xff08;一&#xff09;常函数1. 概念2. 语法格式 …

【2024.6.23】今日科技时事:科技前沿大事件

人不走空 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌赋&#xff1a;斯是陋室&#xff0c;惟吾德馨 目录 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌…

最新!AI大模型的研究热点!

引言 在人工智能的浪潮中&#xff0c;大模型研究如日中天&#xff0c;涵盖诸多研究方向&#xff0c;每个方向均承载着独特的研究焦点与挑战。 以下&#xff0c;我们将逐一探讨数个备受瞩目的研究方向&#xff0c;包括检索增强生成RAG、大模型Agent、Mamba、MoE、LoRA等&#…

【LeetCode】八、堆的使用:第K个最大元素 + 前K和高频单词

文章目录 1、Java中的堆结构2、leetcode215&#xff1a;数组中的第K个最大元素3、leetcode692&#xff1a;前K个高频单词 1、Java中的堆结构 PriorityQueue类取堆顶元素删除堆顶元素堆的元素个数遍历堆 2、leetcode215&#xff1a;数组中的第K个最大元素 这题应该快排来解&…

MyBatis~配置解析, 属性(properties)、设置(settings)

注意, 对应的名称一定要相同, 比如username就要对应username, 而且如果同时使用外部配置文件和property, 优先级是外部配置文件优先级更高 设置&#xff08;settings&#xff09; 这是 MyBatis 中极为重要的调整设置&#xff0c;它们会改变 MyBatis 的运行时行为。 下表描述了…

利用Python控制终端打印字体的颜色和格式

利用Python控制终端打印字体的颜色和格式—操作详解&#xff08;ANSI转义序列&#xff09; 一、问题描述二、ANSI转义序列三、具体代码和显示效果&#xff08;看懂这段代码&#xff0c;以后可随心控制字体的打印格式&#xff09; 欢迎学习交流&#xff01; 邮箱&#xff1a; z……

Linux系统相关函数总结

在应用程序当中&#xff0c;有时往往需要去获取到一些系统相关的信息&#xff0c;譬如时间、日期、以及其它一些系统相关信息&#xff0c;本章将向大家介绍如何通过 Linux 系统调用或 C 库函数获取这些系统信息。除此之外&#xff0c;还会向大家介绍 Linux 系统下的/proc 虚拟文…

Android 13 为应用创建快捷方式

参考 developer.android.google.cn 创建快捷方式 来自官网的说明&#xff1a; 静态快捷方式 &#xff1a;最适合在用户与应用互动的整个生命周期内使用一致结构链接到内容的应用。由于大多数启动器一次仅显示四个快捷方式&#xff0c;因此静态快捷方式有助于以一致的方式执行…

TikTok API接口——获取视频评论信息

一、引言 TikTok&#xff0c;作为全球最受欢迎的短视频社交平台之一&#xff0c;不仅为用户提供了展示才华和分享生活的舞台&#xff0c;也为品牌和企业提供了与年轻用户互动的新渠道。在这个信息爆炸的时代&#xff0c;了解用户的声音、掌握舆论动向显得尤为重要。通过TikTok…

uview中的utabs组件item字数不一致导致滑块偏移

给item单独设置宽度&#xff0c;使滑块计算准确 ::v-deep .u-scroll-box .u-tab-item {width: 80px !important;&:nth-child(3),&:nth-child(4),&:nth-child(5) {width: 60px !important;}flex: 1 1 0% !important; }效果如下&#xff1a;

【TOOL】ceres学习笔记(一) —— 教程练习

文章目录 一、Ceres Solver 介绍二、Ceres 使用基本步骤1. 构建最小二乘问题2. 求解最小二乘问题 三、使用案例1. Ceres Helloworld2. Powell’s Function3. Curve Fitting4. Robust Curve Fitting 一、Ceres Solver 介绍 Ceres-solver 是由Google开发的开源C库&#xff0c;用…

吐血推荐!3款视频生成工具,全部国产,都免费

AI视频大模型的爆发&#xff0c;让创作爆款视频不再是专业人士的能力。 今天二师兄给大家推荐3款免费的视频生成工具。 01 可灵 推荐指数 &#xff1a; 五颗星 先看效果 可灵大模型测试 可灵大模型是快手AI团队自主研发的视频生成大模型&#xff0c;具备强大的视频创作能力&a…