- 相關推薦
搜索引擎的研究與實現(xiàn)ASP+SQL論文
從小學、初中、高中到大學乃至工作,大家總免不了要接觸或使用論文吧,借助論文可以達到探討問題進行學術研究的目的。你知道論文怎樣才能寫的好嗎?下面是小編整理的搜索引擎的研究與實現(xiàn)ASP+SQL論文,希望能夠幫助到大家。
目 錄
1、搜索引擎概述 1
1.1 搜索引擎的實現(xiàn)原理 1
1.1.1 從互聯(lián)網(wǎng)上抓取網(wǎng)頁 1
1.1.2 建立索引數(shù)據(jù)庫 1
1.1.3 在索引數(shù)據(jù)庫中搜索 1
1.1.4 對搜索結果進行處理排序 1
1.2 重要中文搜索策略-中文分詞 2
1.2.1 什么是中文分詞 2
1.2.2 中文分詞技術 3
1.2.3 分詞中的難題 4
1.2.4 中文分詞的應用 5
2、網(wǎng)絡蜘蛛基本原理 6
2.1 網(wǎng)站與網(wǎng)絡蜘蛛 6
2.2 內(nèi)容提取 7
2.3 更新周期 8
3、總體設計 10
3.1 需求分析 10
3.2 問題定義 10
3.3 總體設計 11
3.3.1 管理員部分實現(xiàn) 11
3.3.2 戶部分實現(xiàn) 11
3.3.3 幾個具體流程圖 12
4、數(shù)據(jù)庫設計 15
4.1 數(shù)據(jù)庫設計概述 15
4.2 創(chuàng)建sql server 2000數(shù)據(jù)庫 15
4.3 數(shù)據(jù)庫連接 15
4.3.1 建立數(shù)據(jù)庫的連接 15
4.3.2 執(zhí)行SQL語句 15
4.4 數(shù)據(jù)表的設計 15
4.5 E-R圖設計 16
4.5.1 用戶界面全局E-R圖 16
4.5.2 管理員界面全局E-R圖 17
5、各模塊詳細設計 18
5.1 站搜索模塊 18
5.2 分類目錄模塊 24
5.3 站登錄模塊 26
5.4 網(wǎng)站修改模塊 27
5.5 管理員登錄模塊 29
5.6 網(wǎng)站管理模塊 30
5.6.1 網(wǎng)站修改 31
5.6.2 網(wǎng)站刪除 32
5.7 網(wǎng)站審核模塊 32
5.8 分類管理模塊 32
5.8.1 分類添加 34
5.8.2 分類編輯 34
5.8.3 分類刪除 34
5.9 出系統(tǒng)模塊 34
6、系統(tǒng)功能測試 35
6.1 搜索測試 35
6.2 網(wǎng)站登錄測試 35
6.3 添加分類目錄-商業(yè) 36
6.4 刪除網(wǎng)站測試 37
6.5 測試總結 38
6.5.1 優(yōu)點 38
6.5.2 缺點 38
7、結 論 39
參考文獻 40
致 謝 41
搜索引擎的研究與實現(xiàn)
摘要:在理解搜索引擎實現(xiàn)原理的基礎上實現(xiàn)搜索引擎的基本功能,并對搜索引擎的實現(xiàn)機理進行初步的研究尤其是對中文搜索引擎的研究。
通過對大型的網(wǎng)絡搜索引擎的實現(xiàn)的過程和實現(xiàn)原理的分析加強對搜索引擎這1復雜技術的理解和對其中使用的相關的技術進行學習和研究,并理解網(wǎng)絡蜘蛛的工作原理和中文分詞的技術。并能自己開發(fā)搜索引擎—能夠實現(xiàn)搜索和用戶個人網(wǎng)頁注冊這兩個搜索引擎的基本功能。
本設計的搜索引擎就是采用模糊搜索算法多關鍵字搜索策略實現(xiàn)搜索。模糊搜索就是將索引中內(nèi)容和標題之中含有匹配的關鍵字的網(wǎng)頁搜索出來顯示在結果欄中,并建立相關的超鏈接。而多關鍵字搜索就是將搜索輸入的幾個關鍵字用空格或者非空格隔開的關鍵字替換成空格搜索出具有對應關鍵字的網(wǎng)頁。
關鍵詞:中文搜索;研究;實現(xiàn)
Search engine research and its implementation
Abstract:In the understanding of the principles of search engines to implement a basis for the basic functions of search engines, and search engine mechanisms for the implementation of the initial research, in particular, the study of Chinese search engine. Through large network search engines process and the implementation of the principles of the implementation of the analysis of search engines to enhance the understanding of complex technical and related to the use of the technology study and research and understanding of the operating principles of the network spiders and Chinese sub-term technologies. And to develop my own search engines - users to implement personal web search and search engine registration two basic functions. The design is the use of search engines search algorithm more ambiguous word search strategy to implement search, the search engines to implement understanding principles. Search index is ambiguous, will contain matching content and the title of the show either in the web search results by column, and the establishment of related-links. And multi-word search is to search involving several key cells separated by blank space or non-replacement of the word into a blank space with the corresponding word search website.
Keyword:Chinese search;research;implementation
1、搜索引擎概述
1.1 搜索引擎的實現(xiàn)原理
搜索引擎的實現(xiàn)原理,可以看作4步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索→對搜索結果進行處理和排序。
1.1.1 從互聯(lián)網(wǎng)上抓取網(wǎng)頁
利用能夠從互聯(lián)網(wǎng)上自動收集網(wǎng)頁的 網(wǎng)絡蜘蛛 程序,自動訪問互聯(lián)網(wǎng),并沿著任何網(wǎng)頁中的所有URL爬到其它網(wǎng)頁,重復這過程,并把爬過的所有網(wǎng)頁收集到服務器中。
1.1.2 建立索引數(shù)據(jù)庫
由索引系統(tǒng)程序對收集回來的網(wǎng)頁進行分析,提取相關網(wǎng)頁信息(包括網(wǎng)頁所在URL、編碼類型、頁面內(nèi)容包含的關鍵詞、關鍵詞位置、生成時間、大小、與其它網(wǎng)頁的鏈接關系等),根據(jù)1定的相關度算法進行大量復雜計算,得到每1個網(wǎng)頁針對頁面內(nèi)容中及超鏈中每1個關鍵詞的相關度(或重要性),然后用這些相關信息建立網(wǎng)頁索引數(shù)據(jù)庫。
1.1.3 在索引數(shù)據(jù)庫中搜索
當用戶輸入關鍵詞搜索后,分解搜索請求,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關鍵詞的所有相關網(wǎng)頁。
1.1.4 對搜索結果進行處理排序
所有相關網(wǎng)頁針對該關鍵詞的相關信息在索引庫中都有記錄,只需綜合相關信息和網(wǎng)頁級別形成相關度數(shù)值,然后進行排序,相關度越高,排名越靠前。最后由頁面生成系統(tǒng)將搜索結果的鏈接地址和頁面內(nèi)容摘要等內(nèi)容組織起來返回給用戶。
【搜索引擎的研究與實現(xiàn)ASP+SQL論文】相關文章:
搜索引擎檢索子系統(tǒng)的設計與實現(xiàn)ASP+SQL11-23
網(wǎng)絡購物系統(tǒng)的設計與實現(xiàn)ASP+SQL03-08
購物網(wǎng)站的設計與實現(xiàn)ASP+SQL03-08
CPM搜索引擎的設計與實現(xiàn)03-08
新聞網(wǎng)系統(tǒng)設計與實現(xiàn)ASP+SQL11-23
基于ASP的網(wǎng)上銀行的設計與實現(xiàn)ASP+SQL03-08
網(wǎng)絡新聞發(fā)布系統(tǒng)的設計與實現(xiàn)ASP+SQL11-23
基于ASP的網(wǎng)絡辦公系統(tǒng)設計與實現(xiàn)ASP+SQL03-08