本文是一篇金融論文,本文探討了創(chuàng)新信息載荷對股票收益的影響。首先通過回歸分析檢驗創(chuàng)新信息載荷對股票收益的影響,結(jié)果發(fā)現(xiàn)創(chuàng)新信息載荷對股票收益存在顯著正向影響,在加入控制變量后的回歸擬合程度也有所提高,通過投資組合分析也得出相同結(jié)論,這說明創(chuàng)新信息載荷越高的企業(yè),股票回報越高,通過創(chuàng)新信息載荷進行買多做空的投資組合能夠賺取額外的超額收益。
第一章緒論
1.1研究背景及研究意義
1.1.1研究背景
自21世紀(jì)以來,全球進入了信息時代,這使得傳統(tǒng)經(jīng)濟逐漸向知識經(jīng)濟轉(zhuǎn)型。知識經(jīng)濟是指在現(xiàn)代經(jīng)濟中,知識的創(chuàng)造、獲取、傳播和利用成為經(jīng)濟增長和社會進步的主要驅(qū)動力量。在知識經(jīng)濟時代,企業(yè)創(chuàng)新已然成為企業(yè)持續(xù)發(fā)展的關(guān)鍵因素之一。首先。企業(yè)創(chuàng)新可以幫助企業(yè)獲得更多的知識資產(chǎn),從而提高企業(yè)的競爭力,贏得更多的市場份額。其次,在知識經(jīng)濟時代,市場變化非??欤髽I(yè)必須能夠及時適應(yīng)市場變化,否則就會被市場淘汰,企業(yè)創(chuàng)新可以幫助企業(yè)及時把握市場機會,適應(yīng)市場變化,保持市場競爭力。第三,知識經(jīng)濟時代下的企業(yè)必須具備高效率和高質(zhì)量的生產(chǎn)能力,企業(yè)通過創(chuàng)新可以引進先進的生產(chǎn)技術(shù)和生產(chǎn)工具,提高生產(chǎn)效率和質(zhì)量,從而降低成本,提高利潤。最后,企業(yè)通過創(chuàng)新可以退出具有競爭力的新產(chǎn)品或服務(wù),樹立企業(yè)的良好形象,提高品牌價值,吸引更多的顧客和投資者。種種表明在知識經(jīng)濟時代,企業(yè)創(chuàng)新是企業(yè)持續(xù)發(fā)展的必要條件之一,只有不斷創(chuàng)新,才能不斷提高企業(yè)的競爭力和市場份額,適應(yīng)市場變化,提高生產(chǎn)效率和質(zhì)量,樹立企業(yè)形象和品牌價值,保持企業(yè)的持續(xù)發(fā)展。
世界知識產(chǎn)權(quán)組織日前發(fā)布的《世界知識產(chǎn)權(quán)指標(biāo)》報告顯示,雖然2020年全球經(jīng)濟受到新冠疫情的沖擊,但2020年全球知識產(chǎn)權(quán)申請活動依然強勁。其中,中國創(chuàng)新主體專利申請量超過140余萬件,專利、商標(biāo)、植物新品種申請量均居世界首位,呈現(xiàn)強勁增長態(tài)勢。在信息通信技術(shù)領(lǐng)域,數(shù)字通信、計算機技術(shù)和信息管理等方向的專利申請量顯著增長,其中,計算機技術(shù)專利申請量居科技領(lǐng)域首位。但隨著專利數(shù)量的增長,提高技術(shù)質(zhì)量也尤為重要。從2019年美國制裁中興通訊事件,再到2020年華為事件、2021年格力事件,這都在提醒我們創(chuàng)新是企業(yè)的生命線,企業(yè)只有注重提升創(chuàng)新研發(fā)的速度與把握創(chuàng)新成果的質(zhì)量,才能發(fā)揮創(chuàng)新的最大價值,真正實現(xiàn)創(chuàng)新成果市場化,進而拉動企業(yè)向高質(zhì)量發(fā)展轉(zhuǎn)型。據(jù)世界知識產(chǎn)權(quán)組織統(tǒng)計,專利文獻中包含90%~95%的創(chuàng)新研發(fā)成果,80%以上獨特創(chuàng)新公開技術(shù)未出現(xiàn)在其他專利文獻里,全球90%以上的發(fā)明創(chuàng)造首先通過專利文件表現(xiàn)出來;專利文獻反映前沿科技的信息和數(shù)據(jù),可以作為科學(xué)研究的參考,為研究者提供重要資源庫;對專利信息進行有效利用能夠節(jié)約60%以上的研發(fā)時間,降低40%的研發(fā)成本,種種數(shù)據(jù)都表明專利信息具有重要意義。
1.2研究思路
1.2.1研究內(nèi)容
首先本文以我國信息行業(yè)上市公司為研究對象,選擇2005-2020年的專利文本摘要內(nèi)容通過文本挖掘計算其創(chuàng)新信息載荷,并基于創(chuàng)新信息載荷度量我國信息行業(yè)上市公司的創(chuàng)新水平,并以實例分析其創(chuàng)新水平與股票收益的關(guān)系。緊著分別采用回歸分析法及投資組合分析法檢驗創(chuàng)新信息載荷與股票收益的關(guān)系,并通過Fama-French三因子模型與五因子模型檢驗創(chuàng)新信息載荷-股票收益效應(yīng)是否源自風(fēng)險。最后,基于創(chuàng)新信息載荷構(gòu)建創(chuàng)新信息因子,并檢驗創(chuàng)新信息因子是否為冗雜因子;同時,在Fama-French三因子模型或五因子模型中加入創(chuàng)新信息因子并進行GRS檢驗,分析加入創(chuàng)新信息因子后的資產(chǎn)定價效率?;谏鲜鏊悸?,本文分為七個章節(jié),內(nèi)容如下:
第一章:緒論;首先介紹本文研究背景,并從不同角度說明本文的研究意義,確定研究思路,接著對本文的主要內(nèi)容、技術(shù)路線、研究方法作出詳細(xì)說明,最后總結(jié)本文的創(chuàng)新之處,為后文的研究做基礎(chǔ)。
第二章:文獻綜述;本文首先論述基于關(guān)鍵詞提取的文本挖掘研究現(xiàn)狀,主要通過關(guān)鍵詞提取方法與關(guān)鍵詞選取指標(biāo)方法兩方面進行概述;其次,對資產(chǎn)定價模型相關(guān)研究進行概述;第三,對企業(yè)創(chuàng)新能力與股票收益研究進行概述,主要從企業(yè)創(chuàng)新能力的度量與創(chuàng)新能力與股票收益的關(guān)系研究、文本分析法在股票收益應(yīng)用方面進行概述。最后,對上述文獻部分進行文獻總結(jié)與述評。
第三章:理論基礎(chǔ);本章節(jié)主要介紹專利文本分析法、投資Q理論與基于TF-IDF的中文關(guān)鍵詞提取技術(shù)三方面進行分別進行闡述。
第四章:基于企業(yè)專利文本信息的創(chuàng)新信息載荷指標(biāo)構(gòu)建與分析;首先通過對測度創(chuàng)新信息載荷的TF-IDF算法進行具體說明,然后選取我國信息行業(yè)上市公司2005-2020年的專利文本摘要內(nèi)容,并對信息行業(yè)創(chuàng)新信息載荷與股票收益的關(guān)系進行案例說明,數(shù)據(jù)主要來源于Patsnap智慧芽專利數(shù)據(jù)庫。同時,通過Citespace軟件對信息行業(yè)上市公司進行專利主題演化網(wǎng)絡(luò)分析與關(guān)鍵詞時區(qū)突現(xiàn)分析,以預(yù)測專利熱點與未來發(fā)展趨勢,并從一定程度對企業(yè)掌握研發(fā)熱點更有利于增收提供佐證。
第二章文獻綜述
2.1基于關(guān)鍵詞提取的文本挖掘研究現(xiàn)狀
隨著網(wǎng)絡(luò)上非結(jié)構(gòu)化文本的數(shù)據(jù)增多,利用文本挖掘?qū)φZ義相同或相似的文本進行去重并抽取關(guān)鍵詞以凸顯該文本內(nèi)容的主題與核心,能夠充分挖掘文本內(nèi)容的有效信息并作用于目標(biāo)的實現(xiàn)。在查閱國內(nèi)外相關(guān)文獻后,發(fā)現(xiàn)基于關(guān)鍵詞提取的研究主要分為兩大類:一是關(guān)鍵詞抽取方法;二是關(guān)鍵詞選取指標(biāo)方法。
(1)關(guān)鍵詞抽取方法
從目前的研究來看,對于關(guān)鍵詞抽取方法,研究者主要將其分為有監(jiān)督方法與無監(jiān)督方法。有監(jiān)督方法是指預(yù)先建立一個帶標(biāo)簽數(shù)據(jù)集的訓(xùn)練庫,借助分類算法判斷候選詞是否為關(guān)鍵詞。盡管有監(jiān)督方法可以有效地提高關(guān)鍵詞抽取的準(zhǔn)確率,但由于需要不斷注入大量的標(biāo)簽數(shù)據(jù),而語料集難以窮盡,這種方法受到了一定制約。相比之下,無監(jiān)督方法通過計算候選詞與整個語料庫之間的相似度,以及候選詞在整個語料庫的位置等信息來確認(rèn)是否為關(guān)鍵詞,盡管存在一定誤差率,但具有良好的可拓展性與實用性,可以大大提高專利文本的處理效率和準(zhǔn)確性。因此,在未來的關(guān)鍵詞抽取研究中,無監(jiān)督方法將繼續(xù)得到廣泛應(yīng)用和推廣。其主要分為基于統(tǒng)計的方法、基于圖的方法和基于文本聚類的方法。
基于統(tǒng)計的關(guān)鍵詞抽取方法是指根據(jù)詞語在文本中的詞頻、詞權(quán)重、詞語間的關(guān)聯(lián)程度來判斷詞語是否能夠作為文本關(guān)鍵詞的方法,主要分為詞頻分析法、共詞分析法。詞頻分析法通過計算文本中的每個詞出現(xiàn)頻率來分析文本,在研究熱點與進行熱點遷移與前沿分析方面具有廣泛應(yīng)用。高勁松(2010)[4]運用詞頻的絕對值對國際專利信息領(lǐng)域的文獻進行高頻詞統(tǒng)計,得出該領(lǐng)域?qū)@芯康臒狳c。奉國和(2020)[5]在統(tǒng)計詞頻時引入了時間因素加權(quán),認(rèn)為越新的詞語對研究熱點的貢獻越大,時間權(quán)重越大,越能代表文檔的特征。余豐民(2020)[6]基于關(guān)鍵詞詞頻統(tǒng)計對學(xué)科研究熱點進行分析,發(fā)現(xiàn)關(guān)鍵詞詞頻不僅能夠揭示研究的熱點,也能揭示熱點研究的變化與漂移程度,即探究熱點的生存周期與存在規(guī)律性。
2.2資產(chǎn)定價模型相關(guān)研究
20世紀(jì)60年代,Sharpe[19]基于投資組合理論首次提出CAPM模型,以線性方程的形式說明了投資組合期望收益與期望風(fēng)險之間的關(guān)系,開啟了資產(chǎn)定價理論與實證研究的發(fā)展。Fama和French(1993)[20]發(fā)現(xiàn)除了系統(tǒng)性風(fēng)險會影響股票收益以外,公司的基本面也會對股票收益率產(chǎn)生影響,基于此將市場風(fēng)險、規(guī)模效應(yīng)與賬面市值比作為風(fēng)險定價因子建立三因子資產(chǎn)定價模型,通過實證檢驗發(fā)現(xiàn)解釋力度要強于CAPM模型,F(xiàn)ama-French三因子模型在資產(chǎn)定價理論發(fā)展中運用廣泛,國內(nèi)外學(xué)者利用該模型檢驗了在不同地區(qū)不同行業(yè)的適用狀況。如張宏亮(2014)[21]通過實證證明Fama-French三因子模型能夠完全解釋我國資本市場的股票預(yù)期收益率,具有一定的適用性。Qingsong Ruan(2017)[22]選取1926年至2015年美國特定五個行業(yè),發(fā)現(xiàn)三因子模型在很大程度上可以解釋各行業(yè)的收益情況,其中市場風(fēng)險溢價因子與投資組合收益的相關(guān)性最強。
后期隨著資本市場的不斷發(fā)展與金融市場環(huán)境的不斷變化,學(xué)者在三因子模型的基礎(chǔ)上進行了不斷改進。Carhart(1997)[23]在Fama-French三因子模型中增加動量因素,使其成為四因子模型。Fama和French(2015)[24]加入盈利因子和投資因子構(gòu)建五因子模型,發(fā)現(xiàn)相比三因子模型,五因子的解釋能力增強。齊岳(2020)[25]認(rèn)為公司的治理水平會影響股票的收益率,并將其作為溢價因子納入三因子模型中,結(jié)果發(fā)現(xiàn),由于公司治理因子的加入,股票組合收益率的解釋力度增強。燕群(2021)[26]認(rèn)為互聯(lián)網(wǎng)技術(shù)的發(fā)展會影響企業(yè)的經(jīng)營發(fā)展進而影響企業(yè)的資本資產(chǎn)價值,通過測度互聯(lián)網(wǎng)技術(shù)滲透度因子,在Fama-French三因子模型上構(gòu)建四因子模型,發(fā)現(xiàn)在高賬面市值比的零售業(yè)企業(yè),四因子模型擬合程度更強。歐陽紅兵(2020)[27]認(rèn)為特質(zhì)下行風(fēng)險會影響個股預(yù)期收益,創(chuàng)新地將特質(zhì)下行風(fēng)險因子引入Fama-French五因子模型中,提高了五因子模型的定價效率。
第三章理論基礎(chǔ)..........................12
3.1專利文本分析法............................12
3.2 Q理論................................12
第四章基于企業(yè)專利文本信息的創(chuàng)新指標(biāo)構(gòu)建與分析........................14
4.1樣本選取及數(shù)據(jù)來源...................................14
4.2創(chuàng)新信息載荷指標(biāo)構(gòu)建..................................14
第五章創(chuàng)新信息載荷與公司股票收益關(guān)系.................25
5.1研究假設(shè)及模型設(shè)定............................................25
5.2樣本數(shù)據(jù)及描述性統(tǒng)計....................................26
六章基于創(chuàng)新信息因子的資產(chǎn)定價分析
6.1創(chuàng)新信息因子作為風(fēng)險因子的檢驗
6.1.1研究假設(shè)
具有高創(chuàng)新能力的企業(yè)往往追求獲得更高的資產(chǎn)利潤率,進而得到更高水平的盈利收入。[47](Hirshleifer,2013)這是因為研發(fā)投入是否能夠帶來創(chuàng)新成果與創(chuàng)新成果是否能夠轉(zhuǎn)化為創(chuàng)新資產(chǎn)往往具有時滯性與不確定性,考慮到與創(chuàng)新資產(chǎn)的未來回報相關(guān)的風(fēng)險與不確定性,導(dǎo)致企業(yè)對創(chuàng)新資產(chǎn)未來預(yù)期回報更高,進而提高盈利水平。換句話說,公司從創(chuàng)新資產(chǎn)中獲得的高回報補償了當(dāng)時投資于創(chuàng)新的高風(fēng)險。因此,企業(yè)創(chuàng)新能力可以作為風(fēng)險的衡量,創(chuàng)新能力越高的企業(yè)會通過獲得高風(fēng)險補償進而獲得更高水平的盈利能力。
6.1.2模型構(gòu)建
自20世紀(jì)60年代Sharpe(1964)[82]等在投資組合理論的基礎(chǔ)上提出CAPM模型以來,有關(guān)資產(chǎn)定價的理論循序發(fā)展。Fama和French(1993)[20]在傳統(tǒng)資產(chǎn)定價模型的基礎(chǔ)上,考慮到市場風(fēng)險、規(guī)模效應(yīng)和賬面市值比的影響構(gòu)建三因子資產(chǎn)定價模型,后又在此基礎(chǔ)上考慮盈利和投資因素的影響構(gòu)建五因子模型,發(fā)現(xiàn)模型的解釋能力得到有效提高[48]。因此,本文分別使用三因子模型和五因子模型檢驗創(chuàng)新信息因子是否能夠作為風(fēng)險因子對股票收益產(chǎn)生影響。首先,對于創(chuàng)新信息因子的構(gòu)建參考李方艷(2022)[83]的做法以四種方式分別構(gòu)建創(chuàng)新信息因子:
(1)按照TF-IDF算法加權(quán)計算出的創(chuàng)新信息載荷權(quán)重,將股票進行五等分劃分,然后通過買入(做多)權(quán)重較高的20%的股票組合,賣出(做空)20%權(quán)重較低的股票組合構(gòu)建創(chuàng)新信息因子(TQ20-20)。
(2)按照TF-IDF算法加權(quán)計算出的創(chuàng)新信息載荷權(quán)重,將股票分為權(quán)重最高組占30%,中間組占40%,最低組占30%;然后通過買入(做多)權(quán)重最高組30%的股票組合,賣出(做空)30%權(quán)重最低組股票組合構(gòu)建創(chuàng)新信息因子(TQ30-30)。
(3)按照TF-IDF算法加權(quán)計算出的創(chuàng)新信息載荷權(quán)重,將股票分為權(quán)重最高組占40%,中間組占20%,最低組占40%;然后通過買入(做多)權(quán)重最高組40%的股票組合,賣出(做空)40%權(quán)重最低組股票組合構(gòu)建創(chuàng)新信息因子(TQ40-40)。
(4)按照TF-IDF算法加權(quán)計算出的創(chuàng)新信息載荷權(quán)重,將股票分為權(quán)重最高組占50%,最低組占50%;然后通過買入(做多)權(quán)重最高組50%的股票組合,賣出(做空)50%權(quán)重最低組股票組合構(gòu)建創(chuàng)新信息因子(TQ50-50)。

第七章結(jié)論
7.1結(jié)論
創(chuàng)新驅(qū)動高質(zhì)量經(jīng)濟發(fā)展是我國實現(xiàn)經(jīng)濟轉(zhuǎn)型的重要戰(zhàn)略舉措,也是面對國際核心技術(shù)競爭最強大的武器。通常來說,創(chuàng)新競爭最激烈、產(chǎn)出成果最多大都集中在高科技領(lǐng)域,因此以信息行業(yè)作為推動數(shù)字化轉(zhuǎn)型和智能化發(fā)展,進而實現(xiàn)各行各業(yè)數(shù)字化升級和智能化改造的先行軍,從微觀角度洞悉我國信息行業(yè)企業(yè)的創(chuàng)新水平是推動信息時代發(fā)展和進步的必由之路。特別地,隨著我國資本市場不斷發(fā)展,知識產(chǎn)權(quán)保護得到重視,企業(yè)利用申請專利來獲得保護的意識增強,在這樣的背景下,探討企業(yè)創(chuàng)新信息載荷水平能否反映在股票市場上具有現(xiàn)實意義。
首先,本文基于TF-IDF算法加權(quán)來測量創(chuàng)新信息載荷,再通過LSI算法進行主題聚類,將專利關(guān)鍵詞劃分在18個主題聚類上并進行演化圖展示。從專利關(guān)鍵詞詞頻演化角度來看,信息行業(yè)研究熱點的出現(xiàn)、發(fā)展和消亡遵循科學(xué)研究的循環(huán)形態(tài),且專利信息的研究熱點呈現(xiàn)比較明顯的集中趨勢:如何提高系統(tǒng)及模塊的精度與效率一直是研究的前沿,而運用深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等人工智能算法進行創(chuàng)造是近期熱點所在。從突現(xiàn)圖來看,我國信息行業(yè)專利成果在不同時期存在差異,專利成果隨著時代的發(fā)展與市場需求變化而變化。同時,通過對專利申請量最多的前100家的公司專利進行文本聚類構(gòu)建旭日圖,發(fā)現(xiàn)與本文基于TF-IDF算法聚類所得基本吻合,進一步證實了本文專利關(guān)鍵詞挖掘的可靠性。
其次,本文探討了創(chuàng)新信息載荷對股票收益的影響。首先通過回歸分析檢驗創(chuàng)新信息載荷對股票收益的影響,結(jié)果發(fā)現(xiàn)創(chuàng)新信息載荷對股票收益存在顯著正向影響,在加入控制變量后的回歸擬合程度也有所提高,通過投資組合分析也得出相同結(jié)論,這說明創(chuàng)新信息載荷越高的企業(yè),股票回報越高,通過創(chuàng)新信息載荷進行買多做空的投資組合能夠賺取額外的超額收益。
最后,本文主要分為兩大方面:一方面,基于投資Q理論探討創(chuàng)新信息載荷-股票收益效應(yīng)是否來源于風(fēng)險因子。實證通過創(chuàng)新信息載荷構(gòu)建四種創(chuàng)新信息因子并代入Fama-French三因子或五因子模型中,發(fā)現(xiàn)創(chuàng)新信息因子系數(shù)在5%的水平下顯著為正,是一個風(fēng)險因子并有效作用于模型中;其次,將創(chuàng)新信息因子與其他因子進行相關(guān)性因子與回歸分析發(fā)現(xiàn),創(chuàng)新信息因子不是一個冗雜因子,能夠解釋市場風(fēng)險溢價因子以外的風(fēng)險溢價,再次證明創(chuàng)新信息因子是會對股票收益定價產(chǎn)生影響的風(fēng)險因子。
參考文獻(略)
相關(guān)文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.