歡迎進入紅數信息技術有限公司官網
4008088160
現在的位置:首頁 > 發布網絡推廣公司-營銷推廣 > 搜索引擎面臨的挑戰
搜索引擎面臨的挑戰
信息來源:湖南優度網絡公司  發布日期:2010/3/31 瀏覽數量:1153
文章導讀: ...
目前搜索引擎是網絡上被使用頻率最高的服務項目之一。隨著Internet的強勢發展,網上龐大的數字化信息和人們獲取所需信息能力之間的矛盾日益突出。國際數據公司(IDC)曾公布的一份報告表明,被大肆宣傳為“使用簡便易用,搜索結果豐富”的搜索引擎技術正在被信息更集中的局域網取代,因為大多數搜索系統的表現與用戶的期望值相差太大,諸如數據量高速增長的視頻、音頻等多媒體信息的檢索,現在仍然是無法突破的難題。搜索引擎越來越不能滿足挑剔的網民們的各種信息需求,這表現在以下幾個方面:

  收集的網頁數量和其數據庫的更新速度存在著不可調和的矛盾。用戶經常無法打開查詢的結果。網絡信息時刻變動,實時搜索幾乎不可能。就是剛剛瀏覽過的網頁,也隨時都有更新、過期、刪除的可能。網絡信息收集與整理是搜索引擎工作的重要一部分。搜索引擎需要定期不斷地訪問網絡資源。目前網絡帶寬不足,網絡速度不夠理想,遍歷如此龐雜的網絡時間花費是非常龐大的,這就是不能實時搜索的原因。

  對多媒體內容的處理尚不成熟。迄今為止,搜索對象主要是文本。基于語義的多媒體搜索技術還不成熟,比如搜索圖片時還只能通過周圍相關的文字進行判斷,而無法根據圖片本身的信息提供檢索。多媒體技術的發展,對搜索引擎提出了更多的要求。人們期望引擎不僅能挑出自己需要的文章,還能挑出自己所關心的圖片、電影、音樂等。

  搜索引擎的“智能”有待提高。一般的公共搜索引擎只能查到HTML格式,主要的原因是搜索引擎的自動排序軟件Spiders蜘蛛程序,只能接受這種格式的網頁。這意味著,在企業內部的局域網上,任何沒有使用HTML格式的信息將無法被外部的搜索引擎查到。這就是為什么像PPT、Word、PDF、電子郵件等文件,以及ERP、CRM等應用軟件的數據庫的信息會長期的“沉沒”在信息的海底中。智能搜索引擎具有跨平臺工作和處理多種混合文檔結構的能力。譬如既能處理HTML(Hyper Text Markup Language,超文本標志語言),又能處理SGML(Standard for General Markup Language,通用標志語言標準)和XML(Extended Marked Language,擴展標志語言)文檔以及其他類型的文檔,譬如Word、WPS等。智能搜索引擎應該可以支持多語言搜索。

  搜索引擎應更好地支持動態網頁,許多蜘蛛軟件不敢去碰動態網頁,怕被變化無窮的動態系統黑洞吸進去出不來。然而,網站使用動態網頁生成工具乃是大事所趨,解決動態網頁查找的問題已經迫在眉睫。

  如何解決這些難題已成為第三代搜索引擎探索的方向。一個好的搜索引擎不再僅憑借數據庫大小、更新頻率、檢索速度、對多語言的支持這幾個基本特性來衡量,隨著數據庫容量的不斷膨脹,如何從龐大的資料庫中精確地找到正確的資料,被公認為是下一代搜索技術的競爭要點。

18973218026
其他業務合作請發下面郵箱
郵箱:254596208@qq.com
地址:湖南省湘潭市岳塘區霞光東路58號(維也納酒店6樓)
營銷型網站建設掃一掃關注官方微信

關注優度

官方微信
官方微博
官網首頁