摘 要:現代化征信體系下,作為傳統信用信息有益補充的新型生產要素,替代數據在征信支持普惠金融發展方面取得了顯著成效,但準確認定并妥善治理替代數據的問題亟待解決。通過分析美國替代數據對信用評分制度的修正路徑,對我國替代數據發展提出加強頂層設計、注重隱私保護、明確采集原則和方式、形成多方共治格局等建議。
關鍵詞:征信;替代數據;數據治理;信用評分
近年來,在“政府+市場”雙輪驅動現代化征信體系下,征信替代數據對傳統借貸數據進行了有益補充,并在征信支持普惠金融發展方面取得了顯著成效。作為一種新型生產要素,征信替代數據的應用能夠進一步滿足近8000萬信用“白戶”的金融訴求。利用替代數據為金融和經濟活動提供信用管理服務,在本質上屬于征信活動,需要納入征信監管。但中國人民銀行2021年1月公布的《征信業務管理辦法(征求意見稿)》(以下簡稱《辦法》)中有關替代 數據的界定、采集方式、功能等規定尚存在不清晰之處,準確認定并妥善治理替代數據的問題亟待 解決。
美國征信行業距今已有150余年的發展歷程,逐步構建了以《公 平 信 用 報 告 法》(Fair Credit Reporting Act)和《平等信用機會法》(Equal Credit Opportunity Act)為核心、10余部法律在內的監管法律體系。隨著大數據時代美國個人消費信用評估公司信用評分(以下簡稱FICO評分)陷入現實困境,美國大型互聯網、金融科技公司在直接或間接助貸服務中對替代數據的應用較為廣泛,走出了一條擴大信貸包容度、降低信貸成本、減少信貸歧視的修正路徑。其獨具特色的治理體系對加強我國征信行業頂層制度設計、規范信用數據采集原則與方式、推動形成多方共治格局等有著重要的借鑒意義。
替代數據與數字化手段的深度結合是解決信用“白戶”真實金融訴求的助推器。截至2020年末,中國人民銀行征信系統共收錄11億自然人、6092.3萬戶企業及其他組織,其中小微企業3656.1萬戶、個體工商戶 1167 萬戶。但仍有約 8000 萬戶小微企業、3500萬個工作五年以內的畢業生、6000萬個民政低保人群等重點群體為信用“白戶”,而征信查詢總量中小微企業占比高達60%。截至2020年末,百行征信累計拓展金融機構1887家,替代數據源渠道數30個,基本實現基礎替代數據源的廣泛覆蓋。
《辦法》對信用信息范圍的擴張使得征信替代數據能夠被納入信用信息范圍。《辦法》第三條將“信用信息”定義為“為金融經濟活動提供服務,用于判斷個人和企業信用狀況的各類信息。包括但不限于:個人和企業的身份、地址、交通、通信、債務、財產、支付、消費、生產經營、履行法定義務等信息,以及基于前述信息對個人和企業信用狀況形成的分析、評價類信息”。因此,作為能夠用以輔助判斷信用狀況的信用數據,替代數據能夠納入前述信用信息的范圍。以個人征信為例,可依數據覆蓋度與可采集性歸納出六類現有實踐中的替代數據(見表1)。
中國人民銀行在2020年底召開的“長三角征信一體化”工作推進現場交流會上指出,市場化的替代數據征信信息互聯互通是當前構建全覆蓋社會征信體系的重要步驟。同年12月獲準成立的樸道征信有限公司專注于借助替代信用數據,向“白戶”與“準白戶”等缺乏信貸記錄群體提供有效金融服務。
第一,頂層設計的不完善限制了替代數據的發展。已出臺8年有余的我國《征信業管理條例》《征信機構管理辦法》難以滿足數據產業飛速發展的需要和覆蓋征信長尾群體的現實需求;《辦法》未來作為中國人民銀行出臺的部門規章,其法律位階較低,導致現有先進地方實踐經驗難以總結與推廣。
第二,征信對象數據權益未得到充分保護。《征信業管理條例》也僅有第三條的宣誓性規定。數據化后的個人信息一般僅經單次授權,卻存在無窮采集、無限使用的弊病。
第三,替代數據采集標準尚不清晰。《辦法》第五條要求征信機構采集信用信息應遵循“最少、必要”原則,且不得過度采集。征信替代數據采集適用與傳統信用信息同一標準,必然難以發揮其通過非主流信用數據包容評價信用“白戶”的功效。
第四,替代數據監管權責、采集方式亟待明確。其“非標準化”特點背后,存在著中國人民銀行與其他監管部門權責劃分不清晰、數據采集與處理標準缺乏透明規范、“全面持牌”要求之下牌照等級劃分不明確等問題。
上述問題的產生,一是因為金融科技時代下征信行業處在轉型發展階段;二是與當前數據確權與處理問題尚未解決息息相關。征信行業處在傳統信用數據采集渠道與來源無法覆蓋征信長尾群體的“尷尬期”,催生出市場化機構對這一過程的革新。但市場化機構對替代信用數據的采集與處理難以滿足個人數據保護的要求,也更難推動信用數據的共享,導致信用的擴張評價與數據的安全保障之間產生了現實沖突。體現這一沖突的典型例子,是《辦法》第五條“最少、必要”原則與第三條所述信用信息范圍擴張之間的矛盾。
美國現代征信業始于以FICO為代表的自動化信用評分的推廣。20世紀初,由信貸專員人為評估信用的方式決定了貸方(Creditor)在信貸過程中的主導地位,但此方式難以保證信用的準確性。一方面,高強度、高負荷的工作自身容易出現錯誤;另一方面,較強的人為因素使得申請者的性格、行為甚至與信貸專員的私人關系對結果影響較大,甚至會超過申請者自身的財務狀況因素。
1956年,FICO率先向零售商店及銀行提供了信用度計算公式,運用公式能夠得出對申請人財務狀況和信譽度的量化評分。20世紀80年代后期,FICO研發的自動化信用評分代替了原有計算公式,并沿用至今(見表2)。
盡管這一方式招致了業界對數據管理準確性和算法歧視方面的批評,但毫無疑問,FICO自動化信用評分相對于傳統征信方式取得了巨大成功,Transunion、Experian 和 Equifax 等信用評級機構(以下簡稱三大評級機構)均依賴FICO所提供的算法模型推出各自的信用評分。截至2010年末,超過90%的貸方使用FICO信用評分作出貸款決策。
自1989年推出至今,FICO信用評分的衡量指標及權重基本沒有變化,自動化信用評分暴露出金融包容度較低、準確性和關聯性質疑、特定群體陷入低信用惡性循環等諸多現實問題。
1. 較低的金融包容度產生“信用隱形”
自動化信用評分的金融包容度較低,產生了嚴重的“信用隱形”問題。信用隱形者主要包括兩類群體:一是未被傳統銀行體系納入的群體;二是信用歷史空白的年輕人。實證研究表明,約有2600萬美國成年人屬于信用隱形群體;除此之外,有1900萬人因信用記錄不足而無法被評分。
一方面,現有征信數據種類的局限性導致難以將大量中低收入群體、年輕人納入在內;另一方面,申請新貸款時需要依據的正是信用評分,導致信用隱形群體在通過主流借貸產品難以獲得較低利率貸款的情況下,轉而求助于高利率、條件嚴苛的發薪日貸款等產品。但此類產品沒有被納入三大評級機構的評分范圍,及時還貸也難離“信用隱形”的尷尬境地。
2.自動化評分準確性和關聯度遭受質疑
受限于評價指標單一、評價方式不當的固有弊端,自動化信用評分陷入準確性和關聯度的質疑。一方面,消費者信用評分是不準確甚至“任意得出的”。26%消費者的信用報告存在錯誤,其中13%的消費者信用報告的錯誤嚴重到使其信用評分偏差25%;1%~3%的消費者被歸入相距兩個或兩個以上的評分類別。另一方面,信用評分體系內的部分指標與信用度的關聯性較小,降低了信用評分的可預測性。例如,被認為與消費者信用度毫無關系的主動降低信用額度的操作,會直接導致信用評分的下降。
3.特定群體陷入低信用惡性循環
信用評價指標的單一與評價方式不當產生了對特定族裔、中小企業等群體的歧視,使其陷入低信用惡性循環。FICO得分低于620的非裔是白色人種的三倍;西班牙裔和非裔中擁有次級貸款信用評分占比分別為 31.5%和 45.1%,遠遠高于白色人種的18.3%。
首先,次級貸款相較于優質信貸工具通常會導致更高的違約率,而因為歷史因素,非裔往往更加頻繁地使用高利率次級貸款,導致該群體“負重前行”;其次,特定族裔,比如拉丁裔等的傳統消費習慣決定了其更偏愛使用現金而非信用卡作為支付工具,這些特定群體的固定消費習慣無法影響信用評分;再次,中小企業由于無法填報美國國稅局W-2稅務申報表格,導致其在傳統信貸評分中處在較為不利的地位。
在上述原因的作用下,特定群體不斷地承擔原有違約記錄的負面影響,陷入“選擇有限信貸工具中的劣質貸款、貸款選擇和還款記錄被評價為低分、信貸工具繼續受限制”的惡性循環。
替代數據(Alternative Data)又稱非傳統性數據 (Non-traditional data),目前美國尚未形成對替代數據 較 為 統 一 的 定 義 。美國金融消費者保護(Consumer Financial Protection Bureau)認為,替代數據是指任何的非傳統數據,對替代數據的使用是描述性而非規范性意義上的,并認為傳統數據和替代數據之間可能沒有涇渭分明的界限。
美國聯邦儲備委員會(The Board of Governors of The Federal Reserve System)認為,替代數據是全國信用評級機構的消費者信用檔案中通常找不到的信息,或通常由消費者作為信貸申請的一部分提供的信息。美國國會研究服務中心(Congressional Research Service)認為,替代數據是指用于確定消費者信用度、且在三大評級機構用以計算信用評分的數據源之外的信息,包括傳統信貸文件中通常不包含的其他消費者財務數據。
國際組織對這一問題也有過探索。國際征信委員會(International Committee of Credit Reporting)將傳統數據定義為個人履行其財務和其他類似義務的歷史,并認為替代數據是通過技術平臺收集的可隨時獲得的數字化信息。世界銀行(The World Bank)認為,替代數據并無普遍接受的統一定義,但認為“通過數字手段獲得大量的數據”是一種共識。
本文傾向于美國征信行業將替代數據定義為:并未納入主流評級機構信用檔案的、通過數字技術可獲取的、具備信用性的信息。替代數據有著動態發展特征,與所在地區經濟水平、金融科技發展水平具有強相關性。回溯2005年,美國信息政策研究所的報告預測了未來替代數據僅包括三類(見圖1)。
與如今較廣泛的替代數據類別相比,能夠清晰地體現十幾年間替代數據范圍的變化(見表3)。
隨著金融科技不斷發展,美國對征信替代數據的應用持續深入。截至2020年末,美國利用經過驗證的替代數據提供解決方案的公司總數為31個,較2010 年提升了 181%;其中利用經消費者許可數據的機構數量增速最高,由3家增至19家(見表4)。
作為 1970 年頒布的美國“最古老金融隱私法規”,《公平信用報告法》旨在實現以下兩大目標:一是通過限制信用信息的披露與適用以保障消費者的隱私;二是確保消費者報告的公平性。征信替代數據適用《公平信用報告法》的監管,該法第603(d)款所規定消費者報告包含的信息范圍較大,包括任何有關消費者信用度、信用狀況、信用能力、性格、一般聲譽、個人特征或生活方式的可識別的個人信息等,很少有消費者信息不屬于該定義的范圍。
就征信數據的采集標準而言,美國政治經濟研究理事會將覆蓋度(Coverage)、集中度(Concentration)和信用性質(Credit-like)作為選取替代數據源的最相關標準,該種“3C”標準較為準確地把握了替代數據源的采集特征。鑒于數據收集的可行性與效率,覆蓋度 90%以上是其認為納入數據源考慮的前提條件。
1.《 公平信用報告法》下的征信機構
《公平信用報告法》第603(f)、604條將消費者報告機構(Customer reporting agency)定義為“為向第三方提供信用評級報告而收集或評估消費者信用信息或其他消費者信息的實體”。第 603(d)(1)條認為“消費者報告”是“使用或計劃使用或收集信息”以 確定消費者符合“信貸、保險和就業(包括背景調查)”資格。根據《公平信用報告法》,任何收集與使用替代數據、并將該數據提供給第三方的非直接貸款人都能夠歸入該定義范疇,包括三大評級機構及其他各類金融科技公司。
《公平信用報告法》607(b)條確立了消費者報告機構的三項義務:一是內容準確,要求信用評級機構遵循適當的程序,確保信用報告的準確性;二是信息披露,要求其制定“讓消費者了解報告內容”的程序;三是救濟措施,要求允許消費者對錯誤信息提出異議,且因與消費者發生爭議導致某些負面信貸信息被刪除的,需在五日之內書面通知消費者。
2.《平等信用機會法》下的貸方
《平等信用機會法》旨在保障征信領域的公平待遇,該法 202.2(m)條規定任何“在正常業務過程中定期參加信貸決定(包括設定信貸條款)的人”均可視為貸方。貸方可以劃分為三種類型:一是定期延長、續期或繼續信貸的人;二是定期安排延長、續期或續期信貸的人;三是參與延長、續期或繼續信貸決定的原始貸方的任何受讓人。傳統信貸機構及機構中各類員工應屬《平等信用機會法》中的貸方,而采集和處理替代數據的科技公司則屬于該法規定的第三種貸方類型。
對替代數據的收集和使用的機構及其業務都應當適用《平等信用機會法》。就規制行為與覆蓋范圍而言,《平等信用機會法》202.2(m)條認定的信貸交易行為范圍非常寬泛,如提供信貸條款、提供信用信息、撤銷或更改或終止信貸等程序均包括在內。
實踐中,違反《平等信用機會法》的征信交易行為主要有兩種:一是對潛在貸款人的差別待遇,包括“從公開的歧視到更微妙的待遇差異”。二是差別性影響。差別性影響的判斷禁止使用表面上中立的標準,但卻會導致在沒有“合法商業需求”情況下對潛在借款人的差別性對待。這對大數據征信機構開展業務提出了較高的標準,要求其注意到潛在貸款人各類差別以論證其“商業需求”合理性。
CFPB于2013年1月制定了B條例并適用于《公平信用報告法》及《平等信用機會法》,其中規定的“不利行動”的制度較為值得借鑒。B條例第2(c)(1)條 規定,貸方采取如下三類“不利行動”時應進行信息披露:一是拒絕以申請中的金額或條款提供信貸;二是信貸賬戶及其條款的中止或負面影響;三是拒絕增加申請人的信用額度。
B條例第9(a)(2)(i)、(ii)條進一 步規定了貸方需要披露與“不利行動”有關的內容,包括貸方基本信息、貸方監管機構基本信息、采取該行動的聲明,以及最重要的一項:告知申請人有權獲得具體原因陳述的權利,對所采取行動具體原因進行陳述,可獲取此信息的聯系人及聯系方式。在此基礎之上,《公平信用報告法》第615(a)條額外要求貸方披露對信用評分造成不利影響的關鍵因素。
第一,有觀點認為該法并未對征信替代數據的信息類型進行限制和細化,消費者難以有針對性地了解信用評分的決策依據與評分改進措施。第二,龐大的數據量與非透明的算法下,《公平信用報告法》能否達到所建立起的高透明度與及時通知的標準還需觀察。第三,《公平信用報告法》的爭議解決措施未能滿足消費者及時糾正信用報告錯誤的訴求。
在Judy Thomas訴TU案中,Thomas自1996年首次發現信用報告中存在錯誤后的6年中,不斷地要求信用報告機構修正信用報告未果,最終獲賠 530萬美元,而這僅僅是遭受此類事件中獲賠成功的少數案例。第四,算法的不透明性使得貸方難以給出B條例下“不利行動”的具體原因以及關鍵因素,這一點在替代數據的應用中尤為明顯。
替代數據能夠幫助增厚“信用隱形”群體信用檔案,拓寬提高信用評分與獲取優質信貸的渠道。少數族裔、青年人和收入較低的群體可以通過更多途徑來贏得信用評級機構的“信任”。例如,學生群體可能并沒有太多申請貸款、還款記錄,但其豐富的社交網絡信息、電商消費習慣甚至成績單等信息,都能夠充分反映其所受的教育水平和理性程度,以便贏得相較傳統評分下更高的信用評分。
2019 年美國聯邦儲備委員會等機構聯合聲明,替代數據能夠擴大沒有傳統信用歷史的消費者獲得信貸的機會。2020年美國政府審計署調查發現,約50%的受調查人群在做出信貸決定時使用了替代數據,替代數據的使用的確能夠達到拓寬信貸渠道的效果。
替代數據的應用使得信貸成本及利率大大降低。
第一,替代數據使征信流程進一步簡化,征信成本顯著降低。大數據征信系統的完善能夠優化公司內部人力資源結構,使得大量前臺信貸人員被算法工程師所替代。而更加線上化的運營也會免去高額租金成本。金融科技貸款能夠加快貸方的信貸決策流程,并使借方能夠獲得更低價格的信貸。
第二,能夠將小部分不良貸款從風險貸款中分離,提升貸款定價合理性,引導信貸成本的進一步降低。Experian 的研究報告指出,即便該筆貸款屬風險貸款大類,但更加豐富的信貸評分檔案也能夠在降低貸款利率方面有改進。
第三,更加完善的信用承銷模型使得不良貸款率走低,貸款定價同步降低。替代數據的應用使得信貸批準率提高 15%,而違約率同比減少12%。第四,金融科技貸款人的業務范圍通常聚焦于年利率低于36%的小額貸款,該類貸款逾期率較低,更易實現信用累積的良性循環。
大數據分析有助于消除人類決策中固有的主觀性與認知偏見,促進創新和實質公平。特定群體從替代數據中的獲益已經遠遠超出了預期。美國政治經濟研究理事會的研究表明,非傳統數據的使用使拉美裔、非裔、25歲以下群體的信貸接受率分別上升了22%、21%、14%,較之以往有較大幅度的提升。
替代數據的應用必然需要機器學習和算法來生成信用報告,算法歧視的現象也引起了較為廣泛的討論。大數據時代替代數據的貸款有可能會“復制現存歧視的方式”并“反映決策者或社會生活中一直存在的歧視”。2018 年歐盟研究認為,算法學習能夠產生借款人的信息組合,這種特定信息組合會無意識地歧視社會弱勢群體。
征信行業發展趨勢決定了替代數據應用的必然性,而如何處理算法歧視的問題并非僅僅存在于征信應用替代數據的過程之中,也是未來大數據征信所亟須解決的問題。盡管無法消除算法本身導致的歧視現象,但相較于以往機械的人工審核方式以及固定指標數十年不調整的傳統評分方式,替代數據的多維度分析仍然有助于大幅度改善非算法歧視的現象。
1
一是應當立足大數據征信業務中替代數據的應用趨勢,推動出臺征信管理法律法規,將現有行政法規、部門規章、地方先進經驗總結吸收上升為法律,從法律層面明確替代數據含義、特征及數據采集與處理方式。
二是以《個人信息保護法》為基準,構建征信對象權益保護配套措施。明確替代數據用于征信應當秉承合法、正當、必要和誠信的原則,確保數據采集的明確性、相關性,并在此基礎上進一步明確數據這一生產要素的權利歸屬與流轉問題。
三是細化《辦法》第三十八條規定的欺詐認定標準與異議處理流程。一方面規定較為嚴格侵權處罰標準與行業禁入名單;另一方面實施征信對象機構申訴與部門投訴雙渠道異議處理制度,最大程度確保對信息采集錯誤、違法違規等侵權行為的高效處置。
四是嘗試構建征信機構對征信對象作出“不利行動”及時通知制度。建立這一制度對征信機構市場化程度與規范化運營有著較高的要求,可借鑒美國B條例的相關規定,從完善欺詐認定與異議處理制度出發,分階段推進。
解決《辦法》第三條所述信用信息范圍擴大與第五條“最少、必要”原則之間的沖突,可以對傳統信用信息與征信替代數據之“最少”“必要”作不同理解與適用。對替代數據而言,應重點判定信用信息的強身份相關性,與信貸償還行為相關的結構化信息(包括正面信息)應視為與身份信息相關,以此尋求在該原則下對替代性數據的擴大解釋。
具體來看,應當依據“4C”標準判斷某項數據是否適合納入征信替代數據的采集范圍。
一是合法性(Compliance)。從微觀層面來看,在替代數據進行信息采集、整理、加工、儲存過程中應當維護信息主體的合法權益;從宏觀層面來看,該過程符合現有《民法典》《個人信息保護法》《辦法》等所構建起的個人信息保護與征信法律體系。
二是信用性(Credibility)。較為精確地反映消費者的信用狀況并預測其未來的還款能力,也是替代數據與原有傳統信用數據融合交互的基礎。
三是覆蓋度(Coverage)。較廣泛的覆蓋度保障了替代數據的采集可得性,也是數據源充分反映居民與企業信用狀況的基礎。
四是可控性(Controllability)。可控性是微觀層面數據合法的體現,更是優化和追溯數據采集、整理、加工、儲存及后續提供信用服務等環節的必然要求。
替代數據采集與處理呈現出信息質量差、權益保障難、數據共享少的三大現實難題,應結合替代數據采集的“4C”標準,著力構建起標準化數據采集方式。
一是應從底層技術層面入手,構建高效、準確、可解構的數據采集處理算法技術,并嘗試建立替代數據真實性交叉驗證機制。
二是在《辦法》現有全持牌要求之上建立分級持牌機制,持一級牌照的征信機構可以收集全部征信數據,持二級牌照的征信機構須在中國人民銀行進行備案,并只能夠收集征信替代數據。中國人民銀行應主導建立分級持牌機構名單的統一公示與查詢系統,便于征信機構與對象進行查詢。
三是要加快市場化機構間以及機構與中國人民銀行征信系統間的數據對接與共享。可借鑒歐盟《數據治理法》(DGA)立法提案所建立的二次利用架構,由監管部門出臺配套制度,規范信用信息使用及共享指導建議。同時,發揮樸道征信與百行征信差異化競爭的“科技+路徑”,嘗試探索少部分市場互聯網征信機構接入樸道征信系統,促進金融數據與政務數據共享,運用區塊鏈等技術推動構建信用數據多方共建共治共享平臺。
四是發布征信替代數據采集負面清單,將覆蓋范圍不廣、采集行為涉及侵犯個人信息權益的數據類型剔除。對于允許采集的數據,還要對采集客體進行強信用性和可控性考量,綜合判斷確定替代數據可采集對象范圍與標準化流程。
推動市場發展,形成多方共治格局
我國具備金融科技加速發展、征信市場存量較大的現實基礎,未來應推動建立具有中國特色“征信+科技”“政府+市場”“全國+地方”的多層次征信發展體系,形成多方共治格局。
一是要繼續確立以中國人民銀行為中心的征信管理體系。金融市場基礎設施建設屬中國人民銀行職能,應將利用金融信貸信息的各類征信機構納入牌照管理,并建立中國人民銀行牽頭、反壟斷執法和個人信息保護等部門聯合執法機制。
二是發揮地方征信行業協會自律協調監管功能。行業協會自律協調監管是中國人民銀行征信管理的必要補充,切實推動行業協會向上反映行業訴求、向下提供各類服務,有效推動各類監管政策及配套制度落地。特別是在征信糾紛解決中,行業協會較為完善的糾紛處理、協調溝通功能在一定程度上解決政府和市場失靈的問題。
三是在完善征信對象侵權舉報制度基礎之上,加強對征信市場各方的宣傳教育,拓寬社會群體的監督渠道,提升征信機構與信息主體的信息保護意識。
四是在政府監管、行業協會自律管理之外,推動信用服務機構、以大數據分析類為代表的金融科技公司、中小微企業、信用示范園區等機構的共建共享,著力著重各類主體的優勢發揮與功能配合,形成較為良好的信用生態循環,進一步推動具有中國特色“征信+科技” “政府+市場”“全國+地方”的多層次征信發展體系建設,形成多方共治格局。
注:本文選自《征信》2021年第10期;本文作者:尚博文
上一篇:劉新海:從個人征信到個人數據產業 2021-11-05
下一篇:連維良:推廣完善“信易貸”模式 夯實信用信息“基礎樁”作用 2021-11-05