上海科技大学GenAI常见问题
发布时间:2024-04-03 浏览次数:129 文章来源:图书信息中心

1. 什么是生成式人工智能GenAI?

生成式人工智能GenAI是人工智能的一个子集,涉及创建或生成新内容,例如文本、图像。GenAI模型经过训练后,能够生成具有训练数据模式和特征的新数据。


2. GenAI Web Chat是基于哪个模型的?

GenAI Web Chat是接入Azure OpenAIGPT-4 TurboGPT-4GPT-3.5 Turbo模型。


3. 这项服务是免费的吗?

图书信息中心提供的GenAI Web Chat服务仅对账户进行配额,不进行收费,但会进行虚拟记账。


4. 哪些人员可以使用这项服务?

目前仅对校内正式教职工开放使用。每月给予固定配额。


5. 我可以信赖AI提供的信息吗?

本服务的模型基于大量数据训练且未连接到互联网。因此AI可能会产生错误的答案,也可能偶然产生有害的指令或有偏见的内容,请您自行核实。


6. 为什么AI给我的答案与我的问题无关?

可能是提示词的不准确让AI有了歧义,也有可能是AI出现了幻觉而编造事实。


7. 超额后我还能继续使用吗?

当月超额后只能等待下月再使用。


8. 现在这个模型是哪个版本的?

当前使用的模型是GPT4-Turbo-1106GPT-4-0613GPT3.5-Turbo-0613版本。


9. AI的数据是实时的吗?

当前的大模型不接入网络,没有办法获取实时数据,AI训练数据的时效基于微软发布该模型的时间。


10. GenAI Web Chat 的工作方式与百度或其他搜索引擎有何不同?

搜索引擎拥有自己的算法,可根据用户请求中的关键字和短语提供相关搜索结果(可在互联网上访问的信息)。用户需要在搜索栏中输入需要内容,以最大限度地提高获得所需信息的机会。搜索引擎首先需要识别与他们的请求相关的关键字,然后进行相应的搜索。GenAI Web Chat 是基于GPT4大语言模型,根据输入的数据进行训练。它的响应是根据训练数据获取的内容,而不是搜索互联网上发布的信息。GenAI Web Chat不仅依靠关键字来理解您的请求,还使用自然语言处理来分析整个请求背后的上下文和意图。这就是您可以与GenAI Web Chat 交谈的原因。这也是GPT4等大模型的主要弱点之一,用户无法控制提供信息的来源。


11. 我可以将文件上传到GenAI Web Chat 供其分析吗?

您可以根据自身需要上传PDFWord类型文本文件供AI进行分析,GPT-4 Turbo模型上传文件的请求字数限制为128000TokensGPT-4模型上传文件的请求字数限制为32000TokensGPT-3.5 Turbo模型上传文件的请求字数限制为16000Tokens,按Ctrl可以多选,文件总大小不超过10MB。文件Tokens根据大模型算法计算与实际字数不同。当前版本仅支持上传文本,不支持图像等其他格式,文本中的图像也无法识别。


12. 什么是Tokens

Tokens是自然语言处理(NLP)领域中用来表示文本序列的基本单元。在大多数现代NLP模型(如GPT-4、BERT等)中,输入文本会被tokenizer(标记器)分解成一系列Tokens,然后再输入到模型中进行处理。

Tokens可以是单个字符(如字母或标点符号)、单词或者子词(subword)。大多数tokenizer会将较长的、低频的单词分解成多个子词Tokens,这样可以减少词表的大小,提高效率。

例如,“教育”被记为4个Tokens,“吃饭”被记为5个Tokens,“上海科技大学”被记为6个Tokens,“Hello”被记为1个Tokens。1000个Tokens粗略估算约定于750个英文单词,500个中文字。


13. 如何查看我还剩下多少ChatGPT/DALLE配额

当您打开GenAI Web Chat时,您可以在页面个人中心中查看剩余的配额。


14. 我可以使用GenAI Web Chat 来帮助我编码吗?

可以在请求中指定AI使用某种编码、编程语言进行代码生成,代码中可能存在错误,您可以复制并粘贴错误消息,GenAI Web Chat 将返回改进的代码或协助您进行调试过程。


15. 我希望以鲁迅文风用英语输出?GenAI Web Chat可以做到这一点吗?

您可以在请求中引导AI使用鲁迅的语气、文风进行输出并翻译成英文。


16. 我需要接受很多培训才能使用GenAI Web Chat吗?

GenAI Web Chat就像您使用QQ、微信一样,您只需要了解一些聊天工具简单的操作就可以使用。


17. GenAI Web Chat 只能使用英语吗?

GenAI Web Chat可以使用中文、英文等多种语言,专有名词或专业术语建议使用英文,AI理解得会更加准确。


18. 我想使用API,要如何申请使用?

在符合《上海科技大学GenAl使用手册》第5章5.2章节API申请的条件下,可以向图书信息中心提出申请,评估通过后交付用户使用。


19. 我能在作业、考试、论文等中使用GenAI吗?

作业及考试请联系课程老师、院所,根据相关规定执行。论文请根据递交平台的相应规则进行使用及引用。


20. 我怎么能更多地了解AI以及在教育、科研、办公中的使用场景?

您可以参加图书信息中心公开的信息素养培训和关注学校各院所相关的AI课程,及有甄别地学习公开渠道的课程、培训和资料等。


21. 我在使用中遇到了问题,在翻看了手册和FAQ后没有找到解决方案,应该怎么办?

  您可以联系图书信息中心it-support@shanghaitech.edu.cn


22. 我的账号密码是什么?

您的账号和密码是您统一身份认证的工号和密码。


23. 使用人工智能工具是否被视为学术不端行为? 

使用GenAI或其他生成式人工智能工具并不自动等同于学术不端行为。在作业和考试中能否使用AI工具请在使用前咨询老师及院所,在论文等学术研究中使用AI请根据平台的相关规则进行使用及引用。


24. GPT-4等有偏见吗?

AI目前都有偏见和刻板印象,因此用户使用时应仔细审查其内容。该模型偏向西方观点,并且在英语中表现最好。一些防止有害内容的步骤仅在英语版本中进行了测试。


25. 使用预设的提示词占用Tokens配额吗?

是的,使用预设的提示词会发送给GPT-4等,也会占用您的配额。


26. 为什么统计的Tokens比我输入得多?

在同一个聊天对话中,AI为了能够理解您的上下文关系,会将您的历史对话一并传输进行分析,这部分也占用您的Tokens。上传的文本同样会在每次问答中重复传递,消耗您的Tokens


27. 我可以在校外使用吗?

GenAI Web ChatAPI仅限校内使用,在校外使用需要先接入学校VPN


28. 我当月的配额没有用完可以延续到下个月吗?

配额会在每月第一天进行重置,上月未使用完的配额不会累加。


29. 当我问 GPT-4 它正在运行什么模型时,它告诉我正在运行GPT-3。为何发生这种情况?

AI无法正确识别“正在运行什么模型”是预期行为。“你运行的是哪个模型?”或“OpenAI 的最新模型是什么?”这样的问题与问模型今天天气怎么样所产生的结果的质量差不多。它可能会返回正确的结果,但这纯粹是偶然的。除训练数据的那部分之外,模型本身没有实际信息。

分享至: