<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>&#8235;תגובות לפוסט: &#34;Latent Semantic Indexing&#34;&#8236;</title>
	<atom:link href="http://www.seoblog.co.il/2005/11/06/latent-semantic-indexing/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.seoblog.co.il/2005/11/06/latent-semantic-indexing/</link>
	<description>&#8235;בלוג חדשות קידום אתרים, שיווק באינטרנט ופרסום במנועי חיפוש.&#8236;</description> 	<lastBuildDate>Fri, 27 Jan 2012 20:57:05 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
	<item>
		<title>&#8235;מאת: Sachbak&#8236;</title>
		<link>http://www.seoblog.co.il/2005/11/06/latent-semantic-indexing/comment-page-1/#comment-16</link>
		<dc:creator>&#8235;Sachbak&#8236;</dc:creator>		<pubDate>Wed, 30 Nov 2005 18:07:00 +0000</pubDate>
		<guid isPermaLink="false">http://www.seoblog.co.il/blog/?p=120#comment-16</guid>
		<description>&#8235;בנוגע לעברית, זה קצת תלוי במימוש.
אם המימוש כולל היוריסטיקות לשוניות (מהתחום של עיבוד שפות טבעיות), אז יכול להיות שתהיה בעיה עם עברית.
אבל בד&quot;כ, ניתוח סמנטי שכזה מסתמך על ניתוח מבני של הדף (למשל, מרחק בין מילים) ולכן אין פה יותר מדי משמעות לשפה של המילים עצמן. האלגוריתם למעשה בודק מחרוזות: נותן לכל מחרוזת ניקוד, בהתאם למסמך, שם הכל במטריצות ומפרק את המטריצות בצורה מסוימת כך שמונחים קרובים יתנו ערכים יותר קרובים. בסופו של דבר, האלגוריתם ממיר את המילה למספר, כך שהשפה לא ממש משנה לו.
וזאת אחת הבעיות המרכזיות עם כל השיטות האלה - הן לא תופסות דקויות של שפה, לעתים דקויות תרבותיות, שרק בני אדם יכולים לתפוס.

- סחבק&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>בנוגע לעברית, זה קצת תלוי במימוש.<br />
אם המימוש כולל היוריסטיקות לשוניות (מהתחום של עיבוד שפות טבעיות), אז יכול להיות שתהיה בעיה עם עברית.<br />
אבל בד&quot;כ, ניתוח סמנטי שכזה מסתמך על ניתוח מבני של הדף (למשל, מרחק בין מילים) ולכן אין פה יותר מדי משמעות לשפה של המילים עצמן. האלגוריתם למעשה בודק מחרוזות: נותן לכל מחרוזת ניקוד, בהתאם למסמך, שם הכל במטריצות ומפרק את המטריצות בצורה מסוימת כך שמונחים קרובים יתנו ערכים יותר קרובים. בסופו של דבר, האלגוריתם ממיר את המילה למספר, כך שהשפה לא ממש משנה לו.<br />
וזאת אחת הבעיות המרכזיות עם כל השיטות האלה &#8211; הן לא תופסות דקויות של שפה, לעתים דקויות תרבותיות, שרק בני אדם יכולים לתפוס.</p>
<p>- סחבק</p>
</div>
]]></content:encoded>
	</item>
</channel>
</rss>

