國內首個類ChatGPT模型:復旦大學MOSS今日正式開源,超100萬條對話訓練數據
復旦大學自然語言處理實驗室開發的新版 MOSS 模型今日正式上線,成為國內首個插件增強的開源對話語言模型。
目前,MOSS 模型已上線開源,相關代碼、數據、模型參數已在 Github 和 Hugging Face 等平臺開放,供科研人員下載。
(相關資料圖)
據介紹,MOSS 是一個支持中英雙語和多種插件的開源對話語言模型,moss-moon 系列模型具有 160 億參數,在 FP16 精度下可在單張 A100 / A800 或兩張 3090 顯卡運行,在 INT4/8 精度下可在單張 3090 顯卡運行。MOSS 基座語言模型在約七千億中英文以及代碼單詞上預訓練得到,后續經過對話指令微調、插件增強學習和人類偏好訓練具備多輪對話能力及使用多種插件的能力。
MOSS 來自復旦大學自然語言處理實驗室的邱錫鵬教授團隊,名字與《流浪地球》電影中的 AI 同名,已發布至公開平臺(https://moss.fastnlp.top/),邀請公眾參與內測。
查看 MOSS 的 GitHub 頁面發現,該項目所含代碼采用 Apache 2.0 協議,數據采用 CC BY-NC 4.0 協議,模型權重采用 GNU AGPL 3.0 協議。如需將該項目所含模型用于商業用途或公開部署,需要簽署文件并發送至 robot@fudan.edu.cn 取得授權,商用情況僅用于記錄,不會收取任何費用。
MOSS 用例:
▲ 解方程
▲ 生成圖片
▲ 無害性測試
模型
moss-moon-003-base: MOSS-003 基座模型,在高質量中英文語料上自監督預訓練得到,預訓練語料包含約 700B 單詞,計算量約 6.67x1022 次浮點數運算。
moss-moon-003-sft: 基座模型在約 110 萬多輪對話數據上微調得到,具有指令遵循能力、多輪對話能力、規避有害請求能力。
moss-moon-003-sft-plugin: 基座模型在約 110 萬多輪對話數據和約 30 萬插件增強的多輪對話數據上微調得到,在 moss-moon-003-sft 基礎上還具備使用搜索引擎、文生圖、計算器、解方程等四種插件的能力。
moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反饋數據上訓練得到的偏好模型,將在近期開源。
moss-moon-003: 在 moss-moon-003-sft 基礎上經過偏好模型 moss-moon-003-pm 訓練得到的最終模型,具備更好的事實性和安全性以及更穩定的回復質量,將在近期開源。
moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基礎上經過偏好模型 moss-moon-003-pm 訓練得到的最終模型,具備更強的意圖理解能力和插件使用能力,將在近期開源。
數據
moss-002-sft-data: MOSS-002 所使用的多輪對話數據,覆蓋有用性、忠實性、無害性三個層面,包含由 text-davinci-003 生成的約 57 萬條英文對話和 59 萬條中文對話。
moss-003-sft-data: moss-moon-003-sft 所使用的多輪對話數據,基于 MOSS-002 內測階段采集的約 10 萬用戶輸入數據和 gpt-3.5-turbo 構造而成,相比 moss-002-sft-data,moss-003-sft-data 更加符合真實用戶意圖分布,包含更細粒度的有用性類別標記、更廣泛的無害性數據和更長對話輪數,約含 110 萬條對話數據。目前僅開源少量示例數據,完整數據將在近期開源。
moss-003-sft-plugin-data: moss-moon-003-sft-plugin 所使用的插件增強的多輪對話數據,包含支持搜索引擎、文生圖、計算器、解方程等四個插件在內的約 30 萬條多輪對話數據。目前僅開源少量示例數據,完整數據將在近期開源。
moss-003-pm-data: moss-moon-003-pm 所使用的偏好數據,包含在約 18 萬額外對話上下文數據及使用 moss-moon-003-sft 所產生的回復數據上構造得到的偏好對比數據,將在近期開源。
標簽:
- 國內首個類ChatGPT模型:復旦大學MOSS今日正式開源,超100萬條對話訓練數據
- 【獨家焦點】雪莉楊的真實身份_雪莉楊
- 上海銀行間同業拆放利率Shibor漲跌互現 環球時訊
- 北京長峰醫院火災后被多家機構“除名”!此前曾獲多個獎項-全球即時
- 縱觀季后賽|一塊“面包”,拯救了全NBA最爛的隊|快播
- 今日最新!大宗交易:泰恩康成交2932.8萬元,折價19.47%(04-20)
- 大宗交易:蘇交科成交1107.14萬元,折價15.62%(04-20) 環球聚看點
- 環球簡訊:長城汽車:一季度歸母凈利潤1.74億元,同比下降89.34%
- 立昂微:一季度凈利潤3443.71萬元 同比下降85.53%
- 木頭姐:生成式 AI ChatGPT 可能會給用戶提供不正確信息 快播
- 建立凈零排放經濟 到2050年需110萬億美元 世界頭條
- 美國19名共和黨議員聯合致信拜登:停止對烏援助
- 環球訊息:機構調查:巴西經濟增長預計2023年為0.9%,2024年為1.5%(1月調查為0....
- 世界觀焦點:世界氣象組織:過去8年全球平均溫度是有記錄以來的最高值
- 據基輔獨立報:加拿大國防部宣布對烏克蘭新的軍事援助計劃。援助計劃包括向北約的...
- 小島交際花 曬同貓貓游戲《流浪》制作團隊合影 天天速遞
- 圣諾生物:子公司醋酸艾替班特注射液獲藥品注冊證書_世界速遞
- 【全球播資訊】齊心集團:4月20日召開董事會會議
- 久盛電氣(301082.SZ):2022年度凈利降10.16%至7900.38萬元 擬10派2元 世界聚焦
- 百大集團(600865.SH)一季度扣非凈利潤2567.15萬元、同比增長60.64% 資訊
- 天天熱點評!不惜醉駕也要去見女友,結果半路車撞報廢,人進鐵窗|打非治違
- 天山雪蓮怎么吃才比較好_天山雪蓮四種簡單做法分享
- 中字頭迅速轉頭向上,中國衛通水下直線沖擊漲停-觀速訊
- 當前速遞!歐洲央行管委雷恩:歐元區通脹率仍過高,不應該過早退出限制性貨幣政策
- 俄羅斯最大的鎳生產商諾里爾斯克鎳公司Nornickel:第一季度鎳產量4.6667萬噸
- 惠譽:由于費用競爭、成本通脹和歐洲投資經理的AUM較低,與費用相關的EBITDA利潤率...
- 今日要聞!據俄新社引述克里姆林宮:俄羅斯總統普京和沙特王儲在通話中討論了歐佩克...
- 傳奇組合!s1mple和內馬爾線下CSGO開黑
- “星艦”爆炸后特斯拉領跌美股,馬斯克身家一日縮水近千億 華爾街分析師:還有下...
- 國內首個類ChatGPT模型:復旦大學MOSS今日
- 【獨家焦點】雪莉楊的真實身份_雪莉楊
- 上海銀行間同業拆放利率Shibor漲跌互現 環
- 北京長峰醫院火災后被多家機構“除名”!此
- 縱觀季后賽|一塊“面包”,拯救了全NBA最
- 今日最新!大宗交易:泰恩康成交2932.8萬元
- 大宗交易:蘇交科成交1107.14萬元,折價15.
- 環球簡訊:長城汽車:一季度歸母凈利潤1.74
- 立昂微:一季度凈利潤3443.71萬元 同比下
- 木頭姐:生成式 AI ChatGPT 可能會給用
- 建立凈零排放經濟 到2050年需110萬億美元
- 美國19名共和黨議員聯合致信拜登:停止對烏
- 環球訊息:機構調查:巴西經濟增長預計2023
- 世界觀焦點:世界氣象組織:過去8年全球平
- 據基輔獨立報:加拿大國防部宣布對烏克蘭新
- 碳酸鋰跌價下的寧德時代:電池價格略降,"鋰
- 小島交際花 曬同貓貓游戲《流浪》制作團隊
- 圣諾生物:子公司醋酸艾替班特注射液獲藥品
- 【全球播資訊】齊心集團:4月20日召開董事
- 久盛電氣(301082.SZ):2022年度凈利降10.16
- 百大集團(600865.SH)一季度扣非凈利潤2567.
- 天天熱點評!不惜醉駕也要去見女友,結果半
- 天山雪蓮怎么吃才比較好_天山雪蓮四種簡單
- 中字頭迅速轉頭向上,中國衛通水下直線沖擊
- 當前速遞!歐洲央行管委雷恩:歐元區通脹率
- 俄羅斯最大的鎳生產商諾里爾斯克鎳公司Norn
- 惠譽:由于費用競爭、成本通脹和歐洲投資經
- 今日要聞!據俄新社引述克里姆林宮:俄羅斯
- 傳奇組合!s1mple和內馬爾線下CSGO開黑
- “星艦”爆炸后特斯拉領跌美股,馬斯克身家










