提示工程
提示工程(Prompt engineering)是人工智能中的一个概念,特别是自然语言处理(NLP)。 在提示工程中,任务的描述会被嵌入到输入中。例如,不是隐含地给予模型一定的参数,而是以问题的形式直接输入。 提示工程的典型工作方式是将一个或多个任务转换为基于提示的数据集,并通过所谓的“基于提示的学习(prompt-based learning)”来训练语言模型。[1][2] 提示工程可以从一个大型的“冻结”预训练语言模型开始工作,其中只学习了提示的表示方法,即所谓的“前缀调整(prefix-tuning)”或“提示调整(prompt tuning)”。[3][4] 语言模型GPT-2和GPT-3[5]是提示工程的重要步骤。
历史
2021年,使用多个NLP数据集的多任务提示工程在新任务上显示出良好的性能。[6] 在小样本学习的例子中,包含思维链的提示在语言模型中显示出更好的推理能力。[7]零样本学习中,在提示中预留鼓励思考链的语句(如“让我们一步一步地思考”)可能会提高语言模型在多步骤推理问题中的表现。[8]这些工具的广泛可及性由几个开源笔记和社区主导的图像合成项目的发布所推动。[9]
一份关于处理提示的描述报告称,在2022年2月,约有170个数据集的2000多个公共提示可用。[10]
2022年,DALL-E、Stable Diffusion、Midjourney等机器学习模型得到公开发布。这些模型以文本提示为输入,并使用其生成图像,这影响了一个与文生图提示有关的新品种提示工程。[11]
文本提示
恶意利用
参考文献
- Alec Radford; Jeffrey Wu; Rewon Child; David Luan; Dario Amodei; 伊爾亞·蘇茨克維, (PDF), 2019, Wikidata Q95726769 (英语), Wikidata Q95726769
- Pengfei Liu; Weizhe Yuan; Jinlan Fu; Zhengbao Jiang; Hiroaki Hayashi; Graham Neubig, (PDF), 2021-07-28, arXiv:2107.13586 , Wikidata Q109286554 (英语), Wikidata Q109286554
- Xiang Lisa Li; Percy Liang. . Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). 2021-08: 4582–4597. doi:10.18653/V1/2021.ACL-LONG.353. Wikidata Q110887424 (英语)., Wikidata Q110887424
- Brian Lester; Rami Al-Rfou; Noah Constant. . Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing. 2021-11: 3045–3059. arXiv:2104.08691 . doi:10.18653/V1/2021.EMNLP-MAIN.243. Wikidata Q110887400 (英语)., Wikidata Q110887400
- Tom Brown; Benjamin Mann; Nick Ryder; et al. . arXiv, Advances in Neural Information Processing Systems 33. Advances in Neural Information Processing Systems. 2020-05-28. ISSN 2331-8422. S2CID 218971783. arXiv:2005.14165 . doi:10.48550/ARXIV.2005.14165. Wikidata Q95727440 (英语)., Wikidata Q95727440
- Victor Sanh; Albert Webson; Colin Raffel; et al, (PDF), 2021-10-15, arXiv:2110.08207 , Wikidata Q108941092 (英语), Wikidata Q108941092
- Jason Wei; Xuezhi Wang; Dale Schuurmans; Maarten Bosma; Ed Chi; 黎曰国; Denny Zhou, (PDF), 2022-01-28, arXiv:2201.11903 , doi:10.48550/ARXIV.2201.11903, Wikidata Q111971110 (英语), Wikidata Q111971110
- Takeshi Kojima; Shixiang Shane Gu; Machel Reid; Yutaka Matsuo; Yusuke Iwasawa, (PDF), 2022-05-24, arXiv:2205.11916 , doi:10.48550/ARXIV.2205.11916, Wikidata Q112124882 (英语), Wikidata Q112124882
- Liu, Vivian; Chilton, Lydia. . ACM Digital Library. Association for Computing Machinery. [2022-10-26]. (原始内容存档于2022-10-26).
- Stephen H. Bach; Victor Sanh; Zheng-Xin Yong; et al, (PDF), 2022-02-02, arXiv:2202.01279 , Wikidata Q110839490 (英语), Wikidata Q110839490
- Monge, Jim Clyde. . MLearning.ai. 2022-08-25 [2022-08-31]. (原始内容存档于2022-08-26) (英语).
- McAuliffe, Zachary. . CNET. [10 March 2023]. (原始内容存档于2023-05-26) (英语).
- Wei, Jason; Wang, Xuezhi; Schuurmans, Dale; Bosma, Maarten; Ichter, Brian; Xia, Fei; Chi, Ed H.; Le, Quoc V.; Zhou, Denny. . 31 October 2022 [2023-06-12]. arXiv:2201.11903 . (原始内容存档于2023-06-07) (英语).
- Wei, Jason; Zhou. . ai.googleblog.com. [10 March 2023]. (原始内容存档于2023-08-11) (英语).
- . [2023-06-13]. (原始内容存档于2023-07-08).
- . [2023-06-13]. (原始内容存档于2023-06-13).
- Willison, Simon. . simonwillison.net. 12 September 2022 [2023-02-09]. (原始内容存档于2023-05-03) (英国英语).
- Papp, Donald. . Hackaday. 2022-09-17 [2023-02-09]. (原始内容存档于2023-05-02) (美国英语).
- Vigliarolo, Brandon. . 19 September 2022 [2023-02-09]. (原始内容存档于2023-03-29) (英语).
- Selvi, Jose. . NCC集团研究. 2022-12-05 [2023-02-09]. (原始内容存档于2023-05-03) (美国英语).
- Edwards, Benj. . Ars Technica. 14 February 2023 [16 February 2023]. (原始内容存档于2023-02-22) (美国英语).
- . Washington Post. 2023 [2023年2月16日]. (原始内容存档于2023年3月6日).
- . OWASP. (原始内容存档于2023-09-07).
- . (原始内容存档于2023-06-11).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.