隱拓智安聯合清華大學電子系NGNLab實驗室共同搭建首個大模型合規自動化評測平臺，為中小科技企業提供私有大模型合規評測服務

由微新創想 · 2023年 8月 14日

引言

隨著去年11月份ChatGPT的火爆，生成式人工智能成為2023年以來科技領域的一大風口。國外、國內多家科技巨頭紛紛加緊布局，加速跟進生成式人工智能服務和產品的研發與上市。但生成式人工智能火爆的同時，也帶來諸如侵犯個人隱私、侵犯知識產權、傳播虛假信息、實施網絡詐騙等諸多法律及道德危害。

5月22日，#AI詐騙正在全國爆發#的話題沖上熱搜第一，起因是包頭警方發布一起利用人工智能（AI）實施電信詐騙的典型案例，福州市某科技公司法人代表郭先生10分鐘內被騙430萬元。這起案件引起了網友們的廣泛討論。

圖片84.png

國家相關部門也十分關注AIGC技術所帶來的社會影響，4月11日國家互聯網信息辦公室起草了《生成式人工智能服務管理辦法(征求意見稿)》，向社會公開征求意見。

5月23日，國家互聯網信息辦公室2023年第12次室務會會議審議通過《生成式人工智能服務管理暫行辦法》（以下簡稱《辦法》），并經國家發展和改革委員會、教育部、科學技術部、工業和信息化部、公安部、國家廣播電視總局同意，于7月13日公布，自8月15日起正式實施。“安全”在本次文件中出現頻次達到了14次。

《辦法》第四條明確了生成式人工智能服務堅持發展與安全并重、促進創新與依法治理相結合的總體原則。規定提供和使用生成式人工智能服務應當堅持社會主義核心價值觀，不得生成法律、行政法規禁止的內容，采取措施防止產生歧視，尊重知識產權、商業道德以及個人信息權益，提高生成內容的準確性和可靠性。

基于上述原則，《辦法》第七條和第八條分別針對生成式人工智能的數據訓練和標注等關鍵技術環節制定詳細規定。

數據是大模型的“燃料”，訓練數據的規模和質量將直接影響人工智能模型的最終表現。但與此同時，模型最終的輸出內容也將深深打上訓練數據的烙印，包括其代表的價值觀等。因此《辦法》第七條首先要求用于生成式人工智能服務的訓練數據、優化訓練數據和基礎模型來源合法，即不得使用非法網站的數據進行模型訓練。來源非法的數據中可能包含不符合社會主義核心價值觀的內容，基于這些數據訓練的模型，其生成的內容也必然將存在社會主義核心價值觀偏差。

在保證訓練數據來源合法的基礎上，提供者還需要進一步確保訓練數據內容合法。具體來說，不得侵害他人依法享有的知識產權，不得非法使用他人的個人信息等。提供者需要采取有效措施提高訓練數據質量、增強訓練數據的真實性、準確性、客觀性、多樣性。

數據標注是大模型訓練過程中的第二個關鍵技術環節，它是實現模型生成內容和人類期望對齊的非常關鍵的手段。因此《辦法》第八條強調提供者在數據標注過程中，應當制定符合本辦法要求的清晰、具體、可操作的標注規則，以保證模型輸出結果與本辦法要求對齊。同時，提供者需要進行細致的過程管理，開展數據標注質量評估，抽樣核驗標注內容的準確性。對標注人員進行必要培訓，提升尊法守法意識，監督指導標注人員規范開展標注工作。

特別需要強調的是，《辦法》第九條明確提出，提供者應當依法承擔網絡信息內容生產者責任，履行網絡信息安全義務。生成式人工智能服務提供者在向公眾提供內容生成服務時，應當意識到其生成的內容具有較強的輿論屬性或社會動員能力，因此必須嚴格把控輸出內容安全，壓實其內容生產者的責任。這是確保生成式人工智能真正實現安全、可靠、可控的必由之路。

除此外，《辦法》還明確了生成式人工智能服務提供者應當履行的服務提供者義務。包括第九條要求對涉及的個人信息履行個人信息保護義務，第十條要求對未成年人采取防沉迷措施的保護義務，第十一條要求對使用者的輸入信息和使用記錄依法履行保護義務，第十三條要求提供安全、穩定、持續的服務，第十五條要求建立健全投訴、舉報機制。

上述內容從多個角度明確了生成式人工智能服務提供者應當履行的服務提供者義務，預期能進一步規范未來大量涌現的生成式人工智能服務。

隱拓智安團隊長期持續與相關部門保持著積極溝通，明確生成式人工智能模型合規的質量標準和邊界，并與清華大學電子系NGNLab實驗室和清華大學天津電子信息研究院網絡開源情報技術創新研究中心達成技術合作，共同搭建首個大模型合規自動化評測平臺，未來將開放給中小科技企業進行私有大模型合規評測服務，幫助中小科技企業合法合規的為廣大用戶提供生成式人工智能服務。

AIGC應用服務安全合規現狀

6月初,隱拓智安依據國家網信辦4月發布的《生成式人工智能服務管理辦法(征求意見稿)》開展,從數據安全、模型安全和內容安全和三方面對市面上生成式人工智能應用的安全性進行全面的檢驗。評測采用了定量注入違規內容提示詞的方式，從敏感內容、違法內容、不良內容和虛假內容等方面檢測生成式人工智能應用在大模型安全上的防范機制是否健全,以及最終生成內容是否存在違規。

結果顯示,經受測試的90%的生成式人工智能應用已經部署了內容安全過濾機制,能夠對敏感提示詞和潛在違規內容進行提前防范過濾。但是通過調整提示詞表達方式,95%的應用仍出現生成違規內容的情況。此外,測試過程中隱拓智安團隊也發現傳統的人工智能內容識別方法在對生成式人工智能的違規敏感內容識別率顯著下降,特別是在判斷生成內容的客觀真實性和識別生成圖像的違規違法元素上存在較大短板。

隨著《生成式人工智能服務管理暫行辦法》的正式施行，AIGC大模型合規評測執行標準有法可依，99%的AIGC應用生成內容不合規的亂象也終將逐步改善。隱拓智安創始團隊早在今年3月份就開始跟相關部門建立溝通渠道并持續跟進相關法規的制定進度，公司內部也迅速組織起一支技術攻堅隊伍，與清華大學電子系NGNLab實驗室和清華大學天津電子信息研究院網絡開源情報技術創新研究中心擬定了大模型自動化合規評測平臺的總體架構及標準化的中小科技企業自助檢測流程。

隱拓智安自研大模型自動化生成式合規檢測平臺

平臺總體架構

圖片85.png

隱拓智安自研的自動化生成模型合規評測平臺，為中小科技企業提供了便捷、高效的生成式模型合規評測服務，將來中小科技企業只需要注冊一個賬號，進行企業工商注冊資質認證并上傳檢測文件后，就可以全自動完成生成式模型合規評測，并輸出合規評測報告。同時隱拓智安還為廣大中小科技企業提供模型優化專家答疑服務，幫助中小科技企業盡可能一次通過合規申報，讓投入大量資源研發訓練的大模型第一時間產生經濟效益回報。

企業自助自動化生成式模型合規檢測流程

圖片86.png

隱拓智安是一家什么樣的公司

深圳市隱拓智安科技有限公司—AIGC時代驅動的AI安全數字服務提供商，團隊核心成員來自清華等一流985高校科研團隊，在人工智能安全、多媒體內容分析和理解等領域深耕數十年，致力于面向大模型安全產業上下游的客戶提供分階段的服務，如訓練數據過濾、數據標注代理、大模型合規測評等。最先進人工智能技術構建AIGC內容安全發展生態矩陣，搭建數字安全治理新范式，為客戶提供新一代基于LLM大模型的智能信息處理平臺。

CTO王丙坤，清華大學電子系博士畢業，中文信息學會開源情報專委會委員。從2010年起，一直從事網絡開源情報信息處理、網絡數據可信與安全、安全領域知識圖譜、區塊鏈安全和網絡社會媒體情感計算的研究。近年來，完成863、973、科技部重點專項、國家自科基金、省科技攻關、省教育廳重點研發等多個國家級或省部級科研項目。曾獲國家教育部科技進步獎、軍內科技進步獎等多項榮譽。

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

隱拓智安聯合清華大學電子系NGNLab實驗室共同搭建首個大模型合規自動化評測平臺，為中小科技企業提供私有大模型合規評測服務

引言

AIGC應用服務安全合規現狀

隱拓智安是一家什么樣的公司

您可能還喜歡...

發表回復取消回復

熱門文章

熱門文章

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

隱拓智安聯合清華大學電子系NGNLab實驗室共同搭建首個大模型合規自動化評測平臺，為中小科技企業提供私有大模型合規評測服務

引言

AIGC應用服務安全合規現狀

隱拓智安是一家什么樣的公司

您可能還喜歡...

沖萬億，江蘇“中心”城市不想再慢了

Jony Ive 和 OpenAI 的 Sam Altman 正探討一款新 AI 設備，但到底是什么？

對標微軟Office 365 AI？國產boardmix發布AI PPT功能！

發表回復 取消回復

熱門文章

熱門文章

發表回復取消回復