<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>وب کاوی - آموزشکده عالی سما شیروان</title>
	<atom:link href="http://samashirvan.wordpress.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://samashirvan.wordpress.com</link>
	<description>Just another WordPress.com weblog</description>
	<lastBuildDate>Mon, 09 Jun 2008 20:05:52 +0000</lastBuildDate>
	<generator>http://wordpress.com/</generator>
	<language>fa</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<cloud domain='samashirvan.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://www.gravatar.com/blavatar/b87edfb58bf4a741d724c08f8bcbedae?s=96&#038;d=http://s.wordpress.com/i/buttonw-com.png</url>
		<title>وب کاوی - آموزشکده عالی سما شیروان</title>
		<link>http://samashirvan.wordpress.com</link>
	</image>
			<item>
		<title>واسط فارسي براي بهبود جامعيت كاوش در وب کاوی</title>
		<link>http://samashirvan.wordpress.com/2008/06/09/%d9%88%d8%a7%d8%b3%d8%b7-%d9%81%d8%a7%d8%b1%d8%b3%d9%8a-%d8%a8%d8%b1%d8%a7%d9%8a-%d8%a8%d9%87%d8%a8%d9%88%d8%af-%d8%ac%d8%a7%d9%85%d8%b9%d9%8a%d8%aa-%d9%83%d8%a7%d9%88%d8%b4-%d8%af%d8%b1-%d9%88%d8%a8/</link>
		<comments>http://samashirvan.wordpress.com/2008/06/09/%d9%88%d8%a7%d8%b3%d8%b7-%d9%81%d8%a7%d8%b1%d8%b3%d9%8a-%d8%a8%d8%b1%d8%a7%d9%8a-%d8%a8%d9%87%d8%a8%d9%88%d8%af-%d8%ac%d8%a7%d9%85%d8%b9%d9%8a%d8%aa-%d9%83%d8%a7%d9%88%d8%b4-%d8%af%d8%b1-%d9%88%d8%a8/#comments</comments>
		<pubDate>Mon, 09 Jun 2008 20:05:52 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=22</guid>
		<description><![CDATA[اين قسمت از عامل ، از يك پايگاه داده تشكيل شده است كه حاوي چندين كلمه معادل  بعضي كلمات خاص كه در چالش ها ذكر گرديد ، مي باشد. اين تناظر ، مي تواند مربوط به  معادل هاي رسم الخط ، معادل هاي مفهومي يا معادل هايي به زبان هاي غير فارسي باشد. [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=22&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p>اين قسمت از عامل ، از يك پايگاه داده تشكيل شده است كه حاوي چندين كلمه معادل  بعضي كلمات خاص كه در چالش ها ذكر گرديد ، مي باشد. اين تناظر ، مي تواند مربوط به  معادل هاي رسم الخط ، معادل هاي مفهومي يا معادل هايي به زبان هاي غير فارسي باشد.  بدين صورت كه با عبور دادن كلمات مورد كاوش از اين واسط و يا با رجوع به اين پايگاه  داده ، عملا يك كاوش بر اساس يك كلمه كليدي خاص ، منجر به  چند كاوش براي كلمات  معادل آن كلمه كليدي خاص مي گردد. با اين ترفند ، صفحات حاوي كلمات معادل ، از دست  نمي رود و پارامتر جامعيت را تقويت مي نمايد.</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/22/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/22/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/22/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/22/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/22/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/22/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/22/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/22/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/22/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/22/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/22/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/22/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=22&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/06/09/%d9%88%d8%a7%d8%b3%d8%b7-%d9%81%d8%a7%d8%b1%d8%b3%d9%8a-%d8%a8%d8%b1%d8%a7%d9%8a-%d8%a8%d9%87%d8%a8%d9%88%d8%af-%d8%ac%d8%a7%d9%85%d8%b9%d9%8a%d8%aa-%d9%83%d8%a7%d9%88%d8%b4-%d8%af%d8%b1-%d9%88%d8%a8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>معماری وب کاوی</title>
		<link>http://samashirvan.wordpress.com/2008/06/09/%d9%85%d8%b9%d9%85%d8%a7%d8%b1%db%8c-%d9%88%d8%a8-%da%a9%d8%a7%d9%88%db%8c/</link>
		<comments>http://samashirvan.wordpress.com/2008/06/09/%d9%85%d8%b9%d9%85%d8%a7%d8%b1%db%8c-%d9%88%d8%a8-%da%a9%d8%a7%d9%88%db%8c/#comments</comments>
		<pubDate>Mon, 09 Jun 2008 20:03:33 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[کنکاو وب]]></category>
		<category><![CDATA[وب ماینینگ]]></category>
		<category><![CDATA[وب کاوی]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=21</guid>
		<description><![CDATA[اين عامل هوشمند ، در خصوص هر يك از چالش هاي رسم الخط زبان فارسي رايانه اي ،  رفتار متفاوتي از خود نشان مي دهد. اين رفتارها بقرار زير است :
الف) تنوع نحوه استفاده از &#8220;مي&#8221;  ، &#8220;ها&#8221; ، پيشوند ها و پسوند ها :
همانطور كه قبلا توضيح داده شد ، موارد فوق بطور [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=21&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="justify">اين عامل هوشمند ، در خصوص هر يك از چالش هاي رسم الخط زبان فارسي رايانه اي ،  رفتار متفاوتي از خود نشان مي دهد. اين رفتارها بقرار زير است :<br />
الف) تنوع نحوه استفاده از &#8220;مي&#8221;  ، &#8220;ها&#8221; ، پيشوند ها و پسوند ها :<br />
همانطور كه قبلا توضيح داده شد ، موارد فوق بطور چسبيده يا جدا از كلمه بكار برده  مي شود. لذا جهت رفع چنين مشكلي ، مي توان در واسط هوشمند ، با حذف كليه فواصل خالي<span lang="en-us">(</span>Blanks<span lang="en-us">)</span> موجود در عبارت مورد كاوش ، اقدام به جستجو بر اساس دنباله اي از حروف همان عبارت ،  بدون هيچگونه فاصله خالي نمود.<br />
ب) بكاربردن &#8220;حمزه&#8221; بصورت هاي مختلف :<br />
جهت حل مشكل فوق ، در عمل هوشمند مورد بحث ، فرآيندي ايجاد مي گردد ، كه طي آن ،  اگر عبارت مورد كاوش حاوي صور مختلف &#8220;حمزه&#8221; باشد ، عملا كاوش ، به چندين جستجو براي  كلمات مشابه ، با حالت هاي مختلف &#8220;حمزه&#8221; تبديل مي شود. بعبارت ديگر كاوش كلمه &#8220;مسئله  &#8221; به كاوش براي كلمات &#8220;مسئله&#8221; و &#8220;مسأله&#8221;  منجر مي شود. مي توان با جايگزيني &#8220;ي&#8221;  بجاي &#8220;ء&#8221; نيز دامنه كاوش را وسيع تر نمود ، مثل &#8220;رئيس&#8221; و &#8220;رييس&#8221;.<br />
ج) استفاده  يا عدم استفاده از &#8220;ء&#8221; در تركيب هاي اضافي يا وصفي :<br />
جهت رفع اين مشكل ، در صورت استفاده كاربر از &#8220;ء&#8221; در عبارت مورد كاوش خود ، واسط  هوشمند اقدام به جستجو براي عبارتي فاقد &#8220;ء&#8221; مي نمايد. در اين صورت نتايج جستجو ،  صفحاتي را كه در محتواي متن آنها از &#8220;ء&#8221; استفاده نشده است نيز شامل مي گردد.<br />
د) استفاده از &#8220;ا&#8221; و &#8220;آ&#8221; :<br />
در اين مورد ، واسط ، بمحض برخورد به كلمه مورد كاوش كه در آن &#8220;ا&#8221; بصورت چسبان يا  غيرچسبان  بكار رفته باشد يا شامل  &#8220;آ&#8221;  باشد ، جستجو را به كاوش براي كلمات جديدي  كه با جايگزيني &#8220;ا&#8221; با &#8220;آ&#8221; ويا &#8220;آ&#8221; با &#8220;ا&#8221; ، ساخته شده اند ، بسط مي دهد. در نتيجه  كاوش براي كلمه &#8220;فرايند&#8221; ، صفحات حاوي كلمه &#8220;فرآيند&#8221; ، از دست نمي رود.<br />
ه) استفاده از اصطلاحنامه<span lang="en-us">(</span>Thesaurus<span lang="en-us">)</span> براي حل مشكل تنوع املايي كلمات :<br />
اين معضل شامل تنوع استفاده از &#8220;ي&#8221; در كلمات عربي مختوم به &#8220;ا&#8221; ، تنوع املايي بعضي  كلمات كه همه درست هستند ، استفاده از كلمات اروپايي بصورت ترجمه فارسي و استفاده  يا عدم استفاده از جمع مكسر براي بعضي كلمات مي باشد كه حل مشكل كليه موارد ، در  ايجاد يك پايگاه داده در سمت خدمت گذار ، مستتر است. اين پايگاه داده شامل نمايه اي  از اين كلمات و كلمات مترادف مي باشد. براي مثال كلمه &#8220;موسي&#8221; ، به كلمه &#8220;موسا&#8221; و  كلمه &#8220;كامپيوتر&#8221; به كلمه &#8220;رايانه&#8221; متناظر شده است. عامل هوشمند با مراجعه به اين  پايگاه داده ، براي عبارت مورد كاوش كاربر ، عبارات مشابهي استخراج كرده ، كاوش را  به جستجو براي اين عبارات ، علاوه بر عبارت اصلي ، بسط مي دهد.<br />
ايجاد چنين پايگاه داده اي ، با مشاوره انجمن ها ، بزرگان و فرهنگستان ادب فارسي  انجام مي پذيرد و بروزآوري آن نيز بصورت دوره اي و با دخالت صاحب نظران مذكور صورت  مي گيرد.نمونه اي از محتويات اين پايگاه داده در جدول زير آمده است :</p>
<p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="center">
<div>
<table id="table9" class="MsoNormalTable" style="border:medium none;width:347.1pt;border-collapse:collapse;margin-left:-22.4pt;" dir="rtl" border="1" cellspacing="0" cellpadding="0" width="463">
<tbody>
<tr>
<td style="background:#ffff99 none repeat scroll 0 0;width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">شناسه</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">واژه اصلي</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">واژه مترادف</span></strong></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">1</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:black;">موسي</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">موسا</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">2</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:black;">امپراتور</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">امپراطور</span></p>
</td>
</tr>
<tr style="height:23.4pt;">
<td style="width:50.1pt;height:23.4pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">3</span></p>
</td>
<td style="width:142.1pt;height:23.4pt;padding:0;" width="189" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">Ontology</span></p>
</td>
<td style="width:154.9pt;height:23.4pt;padding:0;" width="207" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">آنتولوژي</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">3</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">آنتولوژي</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">انتولوژي</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">3</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">آنتولوژي</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">انتالوژي</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">3</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">آنتولوژي</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">هستي شناسي</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">4</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">كامپيوتر</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">رايانه</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">4</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">Computer</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">كامپيوتر</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">5</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">Source</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">منبع</span></p>
</td>
</tr>
<tr>
<td style="width:50.1pt;padding:0 5.4pt;" width="67" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span lang="FA">5</span></p>
</td>
<td style="width:142.1pt;padding:0;" width="189" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">Source</span></p>
</td>
<td style="width:154.9pt;padding:0;" width="207" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">سورس</span></p>
</td>
</tr>
</tbody>
</table>
</div>
<p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="center">جدول (4) نمونه اي از محتويات پايگاه داده مترادف ها.</p>
<p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="justify">و) تبديل كلمات اروپايي به رسم الخط فارسي با همان تلفظ اصلي<span lang="en-us">(</span>Cross  language Retrieval <span lang="en-us">)</span> :<br />
كاربري كه بدنبال اطلاعاتي در خصوص برنامه هاي &#8220;Open Source&#8221; در اينترنت مي باشد ،‌  شايد براي هميشه از دسترسي به صفحاتي كه در آنها كلمه &#8220;سورس باز&#8221; بكار رفته است ،  محروم بماند يا حداقل محكوم به اتلاف زمان زيادي تا رسيدن به چنين كلمه اي و به تبع  ، نتايج مطلوب باشد. لذا در صورتي كه جستجو براي لغت &#8220;سورس&#8221; ، بنحوي همزمان با كاوش  براي كلمه &#8220;Source&#8221; ، حتي بدون اطلاع كاربر ، انجام پذيرد  ،‌ مي توان گفت هم در  سرعت و هم در جامعيت اطلاعات بدست آمده ، ارتقايي صورت گرفته است.<br />
وظيفه واسط ما در اين خصوص اينست كه با مراجعه به پايگاه داده ، كاوش را به كلمه  ساخته شده بر اساس تلفظ انگليسي متناظر نيز گسترش دهد. براي انجام فرآيند حل اين  مشكل بصورت  اتوماتيك و ضمنا استفاده از پايگاه داده معتبرتر و روزآمدتر بعنوان  معيار عملكرد اين واسط ، مي توان روشي پيشنهاد نمود كه كلمه متناظر تلفظ انگليسي  لغات كه با رسم الخط فارسي تهيه مي گردد ، با مراجعه به پايگاه هاي داده بين الملي  حاوي معادل هاي سمبوليك تلفظ كلمات انگليسي (كه در كتاب هاي ديكشنري انگليسي به  انگليسي آمده است) ، كلمه مذبور را تهيه نمود و سپس كاوش را براي آن انجام داد.</p>
<p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="center"><img src="http://www.irandoc.ac.ir/data/e_j/vol4/shahidi3.gif" border="0" alt="" width="480" height="533" /><br />
شكل (3) ساختار واسط كمك فارسي براي بهبود مانعيت</p>
<p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="center"><img src="http://www.irandoc.ac.ir/data/e_j/vol4/shahidi4.gif" border="0" alt="" width="558" height="436" /><br />
شكل (4) ساختار واسط كمك فارسي براي بهبود جامعيت</p>
<div>
<table id="table10" class="MsoNormalTable" style="border:medium none;width:618px;border-collapse:collapse;margin-left:-22.4pt;" dir="rtl" border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td style="background:#ffff99 none repeat scroll 0 0;width:58px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">نام جزء</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:224px;padding:0;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">پردازش مربوط</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:76px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">نام جزء</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:225px;padding:0;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span lang="FA">پردازش مربوط</span></strong></p>
</td>
</tr>
<tr>
<td style="width:58px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span dir="ltr">C1</span></p>
</td>
<td style="width:224px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:black;">حذف</span><span style="color:black;"> &#8220;ء&#8221; </span><span style="color:black;">از</span><span style="color:black;"> </span><span style="color:black;">عبارت</span></p>
</td>
<td style="width:76px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;">C7</span></p>
</td>
<td style="width:225px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">تبديل &#8220;آ&#8221; به &#8220;ا&#8221;</span></p>
</td>
</tr>
<tr>
<td style="width:58px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span dir="ltr">C2</span></p>
</td>
<td style="width:224px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:black;">تبديل &#8220;ؤ&#8221; به &#8220;ئ&#8221; و بالعكس</span></p>
</td>
<td style="width:76px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;">C8</span></p>
</td>
<td style="width:225px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">تبديل &#8220;ا&#8221; به &#8220;آ&#8221; در  			ابتداي كلمات</span></p>
</td>
</tr>
<tr style="height:23.4pt;">
<td style="width:58px;height:18px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span dir="ltr">C3</span></p>
</td>
<td style="width:224px;height:18px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">تبديل &#8220;ئ&#8221; به &#8220;أ&#8221; و  			بالعكس</span></p>
</td>
<td style="width:76px;height:18px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;">C9</span></p>
</td>
<td style="width:225px;height:18px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">اضافه كردن &#8220;ء&#8221; به &#8220;ه&#8221;  			در تركيبات</span></p>
</td>
</tr>
<tr>
<td style="width:58px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span dir="ltr">C4</span></p>
</td>
<td style="width:224px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">تبديل &#8220;ؤ&#8221; به &#8220;أ&#8221; و  			بالعكس</span></p>
</td>
<td style="width:76px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;">C10</span></p>
</td>
<td style="width:225px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">حذف اعراب ها</span></p>
</td>
</tr>
<tr>
<td style="width:58px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span dir="ltr">C5</span></p>
</td>
<td style="width:224px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">تبديل  &#8220;يي&#8221; به &#8220;ئي&#8221; و  			بالعكس</span></p>
</td>
<td style="width:76px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;">C11</span></p>
</td>
<td style="width:225px;padding:0;" valign="top">
<p style="text-align:right;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl"><span style="color:#111111;">تبديل &#8220;ة&#8221; به &#8220;ه ء&#8221; يا  			به &#8220;ه&#8221;</span><span style="color:#111111;"> </span><span style="color:#111111;"> و بالعكس</span></p>
</td>
</tr>
<tr>
<td style="width:58px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span dir="ltr">C6</span></p>
</td>
<td style="width:224px;padding:0;" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">تبديل &#8220;ي&#8221;  			به كاراكتر با يونيكد مشابه</span></p>
</td>
<td style="width:76px;padding:0 5.4pt;" valign="top">
<p style="text-align:center;margin:0 3.75pt 0.0001pt;" dir="ltr" align="center"><span style="color:#111111;">C12</span></p>
</td>
<td style="width:225px;padding:0;" valign="top">
<p style="text-align:right;margin:0 3.75pt 0.0001pt;" dir="ltr" align="right"><span style="color:#111111;">مراجعه به  			پايگاه داده واژه هاي مترادف</span></p>
</td>
</tr>
</tbody>
</table>
</div>
<p style="line-height:150%;margin-top:0;margin-bottom:0;" dir="rtl" align="center">جدول (5) اجزاء وپردازش هاي مربوط به رفع اشكالات رسم الخط</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/21/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/21/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/21/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/21/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/21/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/21/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/21/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/21/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/21/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/21/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/21/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/21/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=21&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/06/09/%d9%85%d8%b9%d9%85%d8%a7%d8%b1%db%8c-%d9%88%d8%a8-%da%a9%d8%a7%d9%88%db%8c/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>

		<media:content url="http://www.irandoc.ac.ir/data/e_j/vol4/shahidi3.gif" medium="image" />

		<media:content url="http://www.irandoc.ac.ir/data/e_j/vol4/shahidi4.gif" medium="image" />
	</item>
		<item>
		<title>نرم‌افزارهاي داده‌كاوي</title>
		<link>http://samashirvan.wordpress.com/2008/05/20/%d9%86%d8%b1%d9%85%e2%80%8c%d8%a7%d9%81%d8%b2%d8%a7%d8%b1%d9%87%d8%a7%d9%8a-%d8%af%d8%a7%d8%af%d9%87%e2%80%8c%d9%83%d8%a7%d9%88%d9%8a/</link>
		<comments>http://samashirvan.wordpress.com/2008/05/20/%d9%86%d8%b1%d9%85%e2%80%8c%d8%a7%d9%81%d8%b2%d8%a7%d8%b1%d9%87%d8%a7%d9%8a-%d8%af%d8%a7%d8%af%d9%87%e2%80%8c%d9%83%d8%a7%d9%88%d9%8a/#comments</comments>
		<pubDate>Tue, 20 May 2008 09:59:02 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[داده کاوی]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=20</guid>
		<description><![CDATA[ 
  طي سال‌هاي گذشته جريان سريعي از تمايل به داده‌كاوي در بازارهاي نرم‌افزاري به وجود آمده است. بيشتر كاربران نرم‌افزارهاي داده‌كاو با تفكر استفاده تجاري از اين نرم‌افزارها، خواهان استفاده از آن شده‌اند. نرم‌افزارهاي داده‌كاو معمولاً سه روش مختلف را براي استفاده از داده‌كاوي به كار مي‌برند. 1) اكتشاف 2) استفاده از مدل‌هاي پيشگويي 3) [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=20&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:right;"> </p>
<p style="text-align:right;">  طي سال‌هاي گذشته جريان سريعي از تمايل به داده‌كاوي در بازارهاي نرم‌افزاري به وجود آمده است. بيشتر كاربران نرم‌افزارهاي داده‌كاو با تفكر استفاده تجاري از اين نرم‌افزارها، خواهان استفاده از آن شده‌اند. نرم‌افزارهاي داده‌كاو معمولاً سه روش مختلف را براي استفاده از داده‌كاوي به كار مي‌برند. 1) اكتشاف 2) استفاده از مدل‌هاي پيشگويي 3) استفاده از آناليز بحث و جدل.</p>
<p style="text-align:right;">  اكتشاف، فرآيند جستجو در داده‌هاست تا الگوهاي مخفي موجود در داده‌ها را بدون هيچ ايدة از پيش تعيين شده‌اي مشخص نمايد. در نرم‌افزارهاي داده‌كاوي مبتني بر مدل‌هاي پيشگويي، الگوهايي كه از يك بانك داده كشف مي‌شوند، براي پيش‌بيني آينده به كار مي‌روند. مدل‌هاي پيش‌بيني به كاربر اجازه مي‌دهند تا داده‌هاي نامشخص را به كار ببرد و اين مقادير نامشخص توسط نرم‌افزار كشف شود.</p>
<p style="text-align:right;">در مدل‌هاي جدلي نيز الگوهاي يافت شده از داده‌ها براي تعيين مقادير غيرعادي به كار مي‌رود. براي تعيين مقادير غير عادي، ابتدا مي‌بايست مقادير عادي شناخته شود تا بر اين اساس مقادير غيرعادي و منحرف شناخته شوند.</p>
<p style="text-align:right;">  نرم‌افزارهاي داده‌كاو در حال حاضر از فعاليت‌ كمتري نسبت به ساير نرم‌افزارهاي هوشمند برخوردار هستند. با اين وجود فعاليت تجاري اين نرم‌افزار را مي‌توان در شش بخش كلي، دسته‌بندي داده‌ها، برآورد مقادير نامشخص، پيش‌بيني مقادير نامشخص, گروه‌بندي تقريبي داد‌ه‌ها، خوشه‌بندي داده‌ها و تشريح روابط بين داده‌ها تقسيم كرد</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/20/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/20/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/20/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/20/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/20/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/20/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/20/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/20/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/20/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/20/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/20/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/20/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=20&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/05/20/%d9%86%d8%b1%d9%85%e2%80%8c%d8%a7%d9%81%d8%b2%d8%a7%d8%b1%d9%87%d8%a7%d9%8a-%d8%af%d8%a7%d8%af%d9%87%e2%80%8c%d9%83%d8%a7%d9%88%d9%8a/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>مفهوم داده کاوی -</title>
		<link>http://samashirvan.wordpress.com/2008/05/20/%d9%85%d9%81%d9%87%d9%88%d9%85-%d8%af%d8%a7%d8%af%d9%87-%da%a9%d8%a7%d9%88%db%8c-2/</link>
		<comments>http://samashirvan.wordpress.com/2008/05/20/%d9%85%d9%81%d9%87%d9%88%d9%85-%d8%af%d8%a7%d8%af%d9%87-%da%a9%d8%a7%d9%88%db%8c-2/#comments</comments>
		<pubDate>Tue, 20 May 2008 09:51:35 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[داده کاوی]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=19</guid>
		<description><![CDATA[     عبارت داده کاوي مترادف با يکي از عبارت هاي استخراج دانش، برداشت اطلاعات، وارسي داده ها و حتي لايروبي کردن داده هاست که در حقيقت کشف دانش در پايگاه داده ها11 (KDD ) را توصيف مي کند. بنابراين ايده اي که مبناي داده کاوي است يک فرآيند با اهميت از شناخت الگوهاي بالقوه مفيد، [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=19&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p>     عبارت داده کاوي مترادف با يکي از عبارت هاي استخراج دانش، برداشت اطلاعات، وارسي داده ها و حتي لايروبي کردن داده هاست که در حقيقت کشف دانش در پايگاه داده ها11 (KDD ) را توصيف مي کند. بنابراين ايده اي که مبناي داده کاوي است يک فرآيند با اهميت از شناخت الگوهاي بالقوه مفيد، تازه و درنهايت قابل درک در داده هاست. واژه کشف دانش در پايگاه داده ها در اوايل دهه 80 در مراجعه به مفهوم کلي، گسترده، سطح بالا و به دنبال جستجوي دانش در اطلاعات شکل گرفته است. داده كاوي كاربرد سطح بالاي فنون و ابزار بكار برده شده براي معرفي و تحليل داده ها ي تصميم گيرندگان است. اصطلاح داده کاوي را آمار شناسان، تحليل گران داده ها و انجمن سيستم هاي اطلاعات مديريت به کار برده اند در حالي که پژوهشگران يادگيري ماشين و هوش مصنوعي از KDD بيشتر استفاده مي کنند. در ادامه چند تعريف از داده کاوي ارائه مي شود.</p>
<p>«داده کاوي يا به تعبير ديگر کشف دانش در پايگاه داده ها، استخراج غير بديهي اطلاعات بالقوه مفيد از روي داده هايي است که قبلاً، ناشناخته مانده اند. اين مطلب برخي از روش هاي فني مانند خوشه بندي، خلاصه سازي داده ها، فراگيري قاعده هاي رده بندي، يافتن ارتباط شبکه ها، تحليل تغييرات و کشف بي قاعدگي را شامل مي شود » ( پياتتسکي شاپيرو، ماتئوس کريستوفر)<br />
« داده کاوي در حقيقت کشف ساختارهاي جالب توجه، غير منتظره و با ارزش از داخل مجموعه وسيعي از داده ها مي باشد و فعاليتي است که اساساً با آمار و تحليل دقيق داده ها منطبق است» هند (1998)<br />
« داده کاوي فرآيند کشف رابطه ها، الگوها و روندهاي جديد معني داري است که به بررسي حجم وسيعي از اطلاعات ذخيره شده در انبارهاي داده با فناوري هاي تشخيص الگو ( مانند رياضي و آمار )  مي پردازد». ( سايت12 <a href="http://www.spss.com">http://www.spss.com</a>)<br />
  کشف دانش در پايگاه داده ها در جهت کشف اطلاعات مفيد از مجموعه بزرگ داده هاست. دانش کشف شده مي تواند قاعده اي باشد تا ويژگي هاي داده ها، الگوهايي که به طور متناسب رخ  مي دهند، خوشه بندي موضوع هاي درون پايگاه داده ها و غيره را توصيف مي کند.</p>
<p>      يک کاربر سيستم KDD بايستي درک بالايي از قلمرو داده ها به منظور انتخاب زير مجموعه صحيحي از داده ها، رده مناسبي از الگوها و معيار خوبي براي الگوهاي جالب داشته باشد. بنابراين سيستم KDD بايد ابزارهايي با اثر تعاملي داشته باشد نه سيستم هاي تجزيه و تحليل خودکار. لذا کشف دانش از پايگاه داده ها بايد مثل يک فرآيند شامل گام هاي زير باشد:</p>
<p>درک قلمرو<br />
آماده کردن مجموعه داده ها<br />
کشف الگوها (داده کاوي)<br />
پردازش بعد از کشف الگو<br />
استفاده از نتايج .<br />
 </p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/19/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/19/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/19/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/19/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/19/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/19/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/19/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/19/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/19/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/19/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/19/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/19/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=19&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/05/20/%d9%85%d9%81%d9%87%d9%88%d9%85-%d8%af%d8%a7%d8%af%d9%87-%da%a9%d8%a7%d9%88%db%8c-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>سا بقه داده کاوی</title>
		<link>http://samashirvan.wordpress.com/2008/05/20/%d9%85%d9%81%d9%87%d9%88%d9%85-%d8%af%d8%a7%d8%af%d9%87-%da%a9%d8%a7%d9%88%db%8c/</link>
		<comments>http://samashirvan.wordpress.com/2008/05/20/%d9%85%d9%81%d9%87%d9%88%d9%85-%d8%af%d8%a7%d8%af%d9%87-%da%a9%d8%a7%d9%88%db%8c/#comments</comments>
		<pubDate>Tue, 20 May 2008 09:39:18 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[داده کاوی]]></category>
		<category><![CDATA[data]]></category>
		<category><![CDATA[mining]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=17</guid>
		<description><![CDATA[ 
      داده کاوي و کشف دانش در پايگاه داده ها از جمله موضوع هايي هستند که همزمان با ايجاد و استفاده از پايگاه داده ها در اوايل دهه 80 براي جستجوي دانش در داده ها شکل گرفت.
      شايد بتوان لوول (1983) را اولين شخصي دانست که گزارشي در مورد داده کاوي تحت عنوان « شبيه [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=17&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:right;"> </p>
<p style="text-align:right;">      داده کاوي و کشف دانش در پايگاه داده ها از جمله موضوع هايي هستند که همزمان با ايجاد و استفاده از پايگاه داده ها در اوايل دهه 80 براي جستجوي دانش در داده ها شکل گرفت.</p>
<p style="text-align:right;">      شايد بتوان لوول (1983) را اولين شخصي دانست که گزارشي در مورد داده کاوي تحت عنوان « شبيه سازي فعاليت داده کاوي » ارائه نمود. همزمان با او پژوهشگران و متخصصان  علوم رايانه، آمار، هوش مصنوعي، يادگيري ماشين و . . . نيز به پژوهش در اين زمينه و زمينه هاي مرتبط با آن پرداخته اند.</p>
<p style="text-align:right;">    پژوهش جدي روي موضوع داده کاوي از اوايل دهه 90 شروع شد. پژوهش ها و مطالعه هاي زيادي در اين زمينه صورت گرفته، همچنين سمينارها، دوره هاي آموزشي و کنفرانس هايي نيز  برگزار شده است. نتايج پايه هاي نظري داده کاوي در تعدادي از مقاله هاي پژوهشي آورده شده است. مثلاً سال 1991 پياتتسکي و شاپيرو 2 « استقلال آماري قاعده ها در داده کاوي» را بررسي نموده اند. سال 1995 هافمن و نش استفاده از داده کاوي و داده انبار3 توسط بانک هاي آمريکا را بررسي نموده و بيان کردند که چگونه اين سيستم ها براي بانک هاي آمريکا قدرت رقابت بيشتري ايجاد مي کنند. چت فيلد مشکلات ايجاد شده توسط داده کاوي را بررسي نمود و همچنين مقاله اي تحت عنوان            « مدل هاي خطي غير دقيق داده کاوي و استنباط آماري » ارايه نمود. هندري نيز ديدگاه اقتصاد سنجي روي داده کاوي را تهيه کرد. در اين سال انجمن داده کاوي همزمان با اولين کنفرانس بين المللي «کشف دانش و داده کاوي» شروع به کار کرد. اين کنفرانس توسعه يافته چهار دوره آموزشي بين المللي در پايگاه هاي داده درسال 1989 تا 1994 بود. انجمن مذكور، يک سازمان علمي به نام                  ACM- SIGKDD را ايجاد نمود. سال 1996 ايميلنسکي4 و منيلا5 ديدگاهي از داده کاوي به عنوان    «پرس و جو کننده از پايگاه هاي استنتاجي6» را پيشنهاد کردند. فاياد، پياتتسکي – شاپيرو، اودوراُسامي پيشرفت هاي کشف دانش و داده کاوي را عنوان کردند. در سال 1997 منيلا خلاصه اي از مطالعه روي اساس داده کاوي ارايه نمود. باربارا و همکاران نيز ديدگاه کاهش داده ها روي داده کاوي را در گزارش کاهش داده هاي نيوجرسي ارايه نمودند. همچنين مي توان براي كاربرد داده کاوي</p>
<p style="text-align:right;">در مديريت مالي مي توان، تحليل داده هاي مالي و مدل سازي مالي بنينگاه و چاچ کز و هيگينز 7 را ملاحظه کرد فريدمن نيز مقاله اي در ارتباط با مفهوم آمار و داده کاوي ارايه نمود. سال 1998 هند 8 مقاله اي تحت عنوان « داده کاوي : آمار يا بيشتر؟ » ارائه نمود. کلينبرگ9 پائوديميتريو و راغان 10 ديدگاه اقتصاد سنجي روي داده کاوي و عملکرد داده کاوي به عنوان يک مسئله بهينه را ارايه نمودند. در اين سال نيز کنفرانس هاي ناحيه اي و بين المللي در مورد داده کاوي برگزار شد که از جمله مي توان به کنفرانس آسيا و اقيانوسيه درباره کشف دانش و داده کاوي اشاره کرد. سال 2000 هند و همکاران و اسميت بحث هاي مقايسه اي بين آمار و داده کاوي را ارايه کردند. سري و استاوا، کولي، رش پاند و تن استفاده از وب در کاوش داده ها و کاربردهاي آن را ارايه کردند. سال 2002 کلاديو کانورسانو و همکاران « مدل آميخته چندگانه جمع پذير تعميم يافته » براي داده کاوي را بررسي نمودند. پائلو و گيانلوکاپاسرون، « داده کاوي ساختارهاي پيوند براي مدل رفتار مصرف کننده » را ارايه نمودند</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/17/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/17/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/17/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=17&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/05/20/%d9%85%d9%81%d9%87%d9%88%d9%85-%d8%af%d8%a7%d8%af%d9%87-%da%a9%d8%a7%d9%88%db%8c/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>مشكلات ومحدوديت هاي وب كاوي در سايت هاي فارسي زبان</title>
		<link>http://samashirvan.wordpress.com/2008/04/27/%d9%85%d8%b4%d9%83%d9%84%d8%a7%d8%aa-%d9%88%d9%85%d8%ad%d8%af%d9%88%d8%af%d9%8a%d8%aa-%d9%87%d8%a7%d9%8a-%d9%88%d8%a8-%d9%83%d8%a7%d9%88%d9%8a-%d8%af%d8%b1-%d8%b3%d8%a7%d9%8a%d8%aa-%d9%87%d8%a7%d9%8a/</link>
		<comments>http://samashirvan.wordpress.com/2008/04/27/%d9%85%d8%b4%d9%83%d9%84%d8%a7%d8%aa-%d9%88%d9%85%d8%ad%d8%af%d9%88%d8%af%d9%8a%d8%aa-%d9%87%d8%a7%d9%8a-%d9%88%d8%a8-%d9%83%d8%a7%d9%88%d9%8a-%d8%af%d8%b1-%d8%b3%d8%a7%d9%8a%d8%aa-%d9%87%d8%a7%d9%8a/#comments</comments>
		<pubDate>Sun, 27 Apr 2008 10:33:26 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[محتوا کاوی وب]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=16</guid>
		<description><![CDATA[
 در دهه هاي اخير ، بيشترين اختلاف نظر در باب شيوه املاي كلمات فارسي بر سر  موضوع جدانويسي يا پيوسته نويسي كلمات مركب بوده است.فرهنگستان زبان و ادب فارسي ،  در اين باب راه ميانه را برگزيده و كوشيده است تا فقط مواردي را كه جدانوشتن و يا  پيوسته نوشتن آنها [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=16&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:right;"><strong><br />
</strong> در دهه هاي اخير ، بيشترين اختلاف نظر در باب شيوه املاي كلمات فارسي بر سر  موضوع جدانويسي يا پيوسته نويسي كلمات مركب بوده است.فرهنگستان زبان و ادب فارسي ،  در اين باب راه ميانه را برگزيده و كوشيده است تا فقط مواردي را كه جدانوشتن و يا  پيوسته نوشتن آنها الزامي است ، تحت قاعده و ضابطه درآورد و شيوه نگارش بقيه كلمات  مركب را به ذوق و سليقه نويسندگان واگذار كند.]فرهنگستان،1382[<br />
بعضي چالش هاي زبان فارسي در رايانه و بخصوص در اينترنت كه باعث تفاوت در نتيجه  جستجو در وب يا وب كاوي مي شود از قرار زير است :<br />
الف) تنوع نحوه استفاده از &#8220;مي&#8221; چسبان و غير چسبان ، مثل كلمات &#8220;مي تواند&#8221; و  &#8220;ميتواند&#8221;.<br />
ب) تنوع نحوه بكاربردن چسبان و غير چسبان &#8220;ها&#8221; ، مثل  &#8220;آن ها&#8221; و &#8220;آنها&#8221;.<br />
ج) بكار بردن بعضي پيشوند ها و پسوند ها ، مثل &#8220;همين كه&#8221; و &#8220;همينكه&#8221; ويا &#8220;هيچ يك&#8221; و  &#8220;هيچيك&#8221; و يا &#8220;راه گشا&#8221; و &#8220;راهگشا&#8221;.<br />
د) بكاربردن &#8220;حمزه&#8221; بصورت هاي مختلف ، مثل &#8220;مسؤول&#8221; و &#8220;مسئول&#8221; يا &#8220;مسأله&#8221; و &#8220;مسئله&#8221;.<br />
ه) استفاده  يا عدم استفاده از &#8220;ء&#8221; ، براي كلمات مختوم به هاي بيان حركت ، در حالت  مضاف ، مثل &#8220;خانة مسكوني&#8221; و &#8220;خانه مسكوني&#8221;.<br />
و) تنوع استفاده از &#8220;ي&#8221; در كلمات عربي مختوم به &#8220;ا&#8221; ، مثل &#8220;موسي&#8221; و &#8220;موسا&#8221;.<br />
ز) تنوع املايي بعضي كلمات كه همه درست هستند ، مثل &#8220;اتاق&#8221; و &#8220;اطاق&#8221;.<br />
ح) استفاده از كلمات اروپايي بصورت زبان اصلي يا ترجمه فارسي بخصوص در متون علمي ،  مثل &#8220;Update&#8221; و &#8220;بروزآوري&#8221;.<br />
ط) استفاده يا عدم استفاده از جمع مكسر براي بعضي كلمات.<br />
ي) تبديل كلمات اروپايي به رسم الخط فارسي با همان تلفظ اصلي ، مثل &#8220;Source&#8221; و  &#8220;سورس&#8221;.<br />
ك) استفاده از &#8220;ا&#8221; و &#8220;آ&#8221; بجاي هم ، مثل &#8220;فرايند&#8221; و &#8220;فرآيند&#8221;.<br />
ل) استفاده يا عدم استفاده از اعراب براي كلمات .<br />
بعبارت ديگر ، يك كاربر ممكن است در جستجوي خود در وب ، كلمه كليدي خاصي را بكار  برد ، ليكن در صفحات وب چنين كلمه اي بكار نرفته باشد و با توجه به مواردي كه در  مورد تنوع كاربري كلمات ، بحث شد ،كلمه مشابهي ثبت شده باشد. بنابراين بسياري از  صفحات وب مطلوب كاربر ، در مجموعه بازيابي شده ، وجود نداشته باشد.</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/16/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/16/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/16/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=16&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/04/27/%d9%85%d8%b4%d9%83%d9%84%d8%a7%d8%aa-%d9%88%d9%85%d8%ad%d8%af%d9%88%d8%af%d9%8a%d8%aa-%d9%87%d8%a7%d9%8a-%d9%88%d8%a8-%d9%83%d8%a7%d9%88%d9%8a-%d8%af%d8%b1-%d8%b3%d8%a7%d9%8a%d8%aa-%d9%87%d8%a7%d9%8a/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>خصوصيات وب هاي فارسي از نظر زبان</title>
		<link>http://samashirvan.wordpress.com/2008/04/27/%d8%ae%d8%b5%d9%88%d8%b5%d9%8a%d8%a7%d8%aa-%d9%88%d8%a8-%d9%87%d8%a7%d9%8a-%d9%81%d8%a7%d8%b1%d8%b3%d9%8a-%d8%a7%d8%b2-%d9%86%d8%b8%d8%b1-%d8%b2%d8%a8%d8%a7%d9%86/</link>
		<comments>http://samashirvan.wordpress.com/2008/04/27/%d8%ae%d8%b5%d9%88%d8%b5%d9%8a%d8%a7%d8%aa-%d9%88%d8%a8-%d9%87%d8%a7%d9%8a-%d9%81%d8%a7%d8%b1%d8%b3%d9%8a-%d8%a7%d8%b2-%d9%86%d8%b8%d8%b1-%d8%b2%d8%a8%d8%a7%d9%86/#comments</comments>
		<pubDate>Sun, 27 Apr 2008 10:32:44 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[محتوا کاوی وب]]></category>
		<category><![CDATA[محتوا]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=15</guid>
		<description><![CDATA[
 عدم وجود يك استاندارد و شناور بودن ويژگيهاي رسم الخط و مفاهيم در زبان فارسي  ، موجب گرديده است تا تقريبا بتعداد صفحات وب فارسي ، سبك و سياق نگارش اين زبان  بكار رفته باشد. ليكن خصوصيات مشترك اكثر وب‌هاي فارسي زبان را مي توان چنين  ارزيابي نمود :
الف) نگارش برخي [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=15&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="line-height:150%;margin-top:0;margin-bottom:0;text-align:right;" dir="rtl"><strong><br />
</strong> عدم وجود يك استاندارد و شناور بودن ويژگيهاي رسم الخط و مفاهيم در زبان فارسي  ، موجب گرديده است تا تقريبا بتعداد صفحات وب فارسي ، سبك و سياق نگارش اين زبان  بكار رفته باشد. ليكن خصوصيات مشترك اكثر وب‌هاي فارسي زبان را مي توان چنين  ارزيابي نمود :<br />
الف) نگارش برخي از وب هاي فارسي ، زبان غيررسمي يا محاوره‌اي است.<br />
ب) در وب‌هاي فارسي ، بخصوص در متون علمي ، اغلب واژه‌هاي بيگانه ، بكرات استفاده  مي‌شود كه بعضي از آنها بارسم الخط زبان اصلي نوشته مي‌شوند.<br />
ج) رسم‌الخط وب هاي فارسي ، اصولا غيراستاندارد و متغير است و اغلب در معرض نوآوري‌  است.<br />
ه) نوشته‌هاي وب‌هاي فارسي ، حاوي غلط‌هاي تايپي و نگارشي نسبتاً زيادي است، هرچند  كه اغلب وب‌هاي فارسي مهم و پرخواننده، نگارش قابل‌قبولي دارند.<br />
و) رسم‌الخط وب‌هاي فارسي، تابع محدوديت‌هاي محيط الكترونيكي و عدم تطبيق آن با  الزامات خط فارسي است.]اشرف زاده،1383[ابزارهاي جستجو در وب هاي فارسي</p>
<p>در حال حاضر ابزارهاي كاوش مختلفي در ايران ظهور پيدا كرده اند.ليكن ابزارهاي  جستجويي كه امكان جستجوي اطلاعات به زبان فارسي را در اختيار قرار مي دهند ،  محدودند. از طرف ديگر ، امكانات و قابليتهاي آن ها براي بازيابي موثر و مناسب  اطلاعات متغير هستند. برخي از ابزارهاي كاوش با امكانات جستجوي فارسي عبارتند از  NPiran  ، Iranhoo  ، IranMehre ، Parseek ، Google و Parseek .بجز سايت‌ NPIran ،  ديگر سايتها داراي‌ واسط‌ جستجوي فارسي‌ هستند و بجز Parseek ، هيچيك از ابزارهاي  موجود كاوش فارسي ، چالش هاي زبان فارسي را با هدف بهينه سازي كاوش فارسي ، فراروي  خود قرار نداده اند و Parseek نيز تنها مشكل  كاراكترهاي فارسي با يونيكدهاي مختلف  را حل نموده است.</p>
<p style="line-height:150%;margin-top:0;margin-bottom:0;text-align:right;" dir="rtl">
<div style="text-align:right;">
<table id="table1" class="MsoNormalTable" style="width:369pt;border-collapse:collapse;" dir="rtl" border="0" cellspacing="0" cellpadding="0" width="492">
<tbody>
<tr>
<td style="background:#ffff99 none repeat scroll 0 0;width:40.65pt;border:1.5pt 1.5pt 1pt 1pt double double solid solid windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>رديف</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:127.85pt;border:1.5pt medium 1pt double none solid windowtext 0;padding:0;" width="170" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>نام ابزار كاوش با واسط جستجوي فارسي</span></strong></p>
</td>
<td style="background:#ffff99 none repeat scroll 0 0;width:200.5pt;border:1.5pt medium 1pt 1.5pt double none solid double windowtext 0 windowtext windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>نشاني دسترسي</span></strong></p>
</td>
</tr>
<tr>
<td style="width:40.65pt;border:medium 1.5pt 1pt 1pt none double solid solid 0 windowtext windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>1</span></strong></p>
</td>
<td style="width:127.85pt;border:medium medium 1pt none none solid 0 0 windowtext;padding:0;" width="170" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr">Google</span></p>
</td>
<td style="width:200.5pt;border:medium medium 1pt 1.5pt none none solid double 0 0 windowtext windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr"> www.google.com/webhp?hl=fa</span></p>
</td>
</tr>
<tr>
<td style="width:40.65pt;border:medium 1.5pt 1pt 1pt none double solid solid 0 windowtext windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>2</span></strong></p>
</td>
<td style="width:127.85pt;border:medium medium 1pt none none solid 0 0 windowtext;padding:0;" width="170" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr">IranClick</span></p>
</td>
<td style="width:200.5pt;border:medium medium 1pt 1.5pt none none solid double 0 0 windowtext windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr">www.iranclick.com</span></p>
</td>
</tr>
<tr>
<td style="width:40.65pt;border:medium 1.5pt medium 1pt none double none solid 0 windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>3</span></strong></p>
</td>
<td style="width:127.85pt;padding:0;" width="170" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr">Iranhoo</span></p>
</td>
<td style="width:200.5pt;border:medium medium medium 1.5pt none none none double 0 0 0 windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr">www.iranhoo.com</span></p>
</td>
</tr>
<tr>
<td style="width:40.65pt;border:1pt 1.5pt 1pt 1pt solid double solid solid black windowtext windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>4</span></strong></p>
</td>
<td style="width:127.85pt;border:1pt medium solid none black 0 windowtext;padding:0;" width="170" valign="top">
<p style="text-align:center;margin:0 3.75pt 0.0001pt;" dir="ltr" align="center"><span style="color:#111111;">IranMehr</span></p>
</td>
<td style="width:200.5pt;border:1pt medium 1pt 1.5pt solid none solid double black 0 windowtext windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;margin:0 3.75pt 0.0001pt;" dir="ltr" align="center"><span style="color:#111111;">www.iranmehr.com</span></p>
</td>
</tr>
<tr>
<td style="width:40.65pt;border:medium 1.5pt 1pt 1pt none double solid solid 0 windowtext windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>5</span></strong></p>
</td>
<td style="width:127.85pt;border:medium medium 1pt none none solid 0 0 windowtext;padding:0;" width="170" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr">Open Directory</span></p>
</td>
<td style="width:200.5pt;border:medium medium 1pt 1.5pt none none solid double 0 0 windowtext windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><span style="color:#111111;" dir="ltr"> http://dmoz.org/World/Farsi</span></p>
</td>
</tr>
<tr>
<td style="width:40.65pt;border:medium 1.5pt 1.5pt 1pt none double double solid 0 windowtext windowtext;padding:0 5.4pt;" width="54" valign="top">
<p style="text-align:center;direction:rtl;unicode-bidi:embed;margin:0 3.75pt 0.0001pt;" dir="rtl" align="center"><strong><span>6</span></strong></p>
</td>
<td style="width:127.85pt;border:medium medium 1.5pt none none double 0 0 windowtext;padding:0;" width="170" valign="top">
<p style="text-align:center;margin:0 3.75pt 0.0001pt;" dir="ltr" align="center"><span style="color:#111111;">Parseek</span></p>
</td>
<td style="width:200.5pt;border:medium medium 1.5pt 1.5pt none none double double 0 0 windowtext windowtext;padding:0 5.4pt;" width="267" valign="top">
<p style="text-align:center;margin:0 3.75pt 0.0001pt;" dir="ltr" align="center"><span style="color:#111111;">www.parseek.com</span></p>
</td>
</tr>
</tbody>
</table>
</div>
<p style="line-height:150%;margin-top:0;margin-bottom:0;text-align:right;" dir="rtl">جدول (1) شش ابزار كاوش برگزيده با واسط جستجوي فارسي همراه با نشاني آنها.</p>
<p style="line-height:150%;margin-top:0;margin-bottom:0;text-align:right;" dir="rtl">
<p style="text-align:right;">در بين ابزارهاي كاوش فوق ، تنها موتور كاوش Google داراي برنامه روبات به منظور  شناسايي و نمايه سازي صفحات يا سايتهاي وب به زبان فارسي و نمايه سازي خودكار مي  باشد و قادر است صفحات فارسي را در قالب Unicode شناسايي و در پايگاه خود نمايه كند  و سايت Parseek نيز از پايگاه Google براي جستجو و بازيابي اطلاعات استفاده مي كند.  به تعبير ديگر، 4 ابزار كاوش ديگر توسط نمايه سازي انساني اداره مي شوند و از اين  لحاظ راهنماي موضوعي تلقي مي شوند. ابزارهاي كاوش ديگر ، راهنماي موضوعي به شمار مي  آيند و انسان ، فرايند شناسايي، بررسي و نمايه سازي سايتها يا صفحات وب را بر عهده  دارد.]كوشا،1381[<br />
بنظر مي رسد جاي يك ابزار كاوش قوي ملي ، تحت نظارت سازمان هاي انفورماتيكي و انجن  هاي زبان شناسي فارسي ، منطبق با نيازهاي اطلاعاتي كاربران اينترنت در ايران وبا در  نظر گرفتن چالش هاي رسم الخط و مفهومي فارسي و مرتفع سازي مشكلات ناشي از آن ها  خالي است.</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/15/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/15/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/15/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/15/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/15/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/15/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/15/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/15/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/15/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/15/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/15/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/15/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=15&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/04/27/%d8%ae%d8%b5%d9%88%d8%b5%d9%8a%d8%a7%d8%aa-%d9%88%d8%a8-%d9%87%d8%a7%d9%8a-%d9%81%d8%a7%d8%b1%d8%b3%d9%8a-%d8%a7%d8%b2-%d9%86%d8%b8%d8%b1-%d8%b2%d8%a8%d8%a7%d9%86/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>محتوا کاوی وب</title>
		<link>http://samashirvan.wordpress.com/2008/04/27/%d9%85%d8%ad%d8%aa%d9%88%d8%a7-%da%a9%d8%a7%d9%88%db%8c-%d9%88%d8%a8/</link>
		<comments>http://samashirvan.wordpress.com/2008/04/27/%d9%85%d8%ad%d8%aa%d9%88%d8%a7-%da%a9%d8%a7%d9%88%db%8c-%d9%88%d8%a8/#comments</comments>
		<pubDate>Sun, 27 Apr 2008 10:30:14 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=14</guid>
		<description><![CDATA[محتواكاوي وب(Web Content Mining) ، يكي از سه شاخه وب كاوي  است كه در واقع ، كشف اطلاعات مفيد از مستندات و داده هاي ساختيافته و نيمه  ساختيافته و غير ساختيافته وب  مي باشد. يك شاخه ديگر اين مقوله ، ساختاركاوي وب(Web  Structure Mining) است كه به كشف مدل پشت زمينه حاكم [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=14&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:right;">محتواكاوي وب(Web Content Mining) ، يكي از سه شاخه وب كاوي  است كه در واقع ، كشف اطلاعات مفيد از مستندات و داده هاي ساختيافته و نيمه  ساختيافته و غير ساختيافته وب  مي باشد. يك شاخه ديگر اين مقوله ، ساختاركاوي وب<span>(</span>Web  Structure Mining<span>)</span> است كه به كشف مدل پشت زمينه حاكم بر  ساختار فرا پيوند هاي وب مي پردازد  و هدف آن ، ايجاد اطلاعاتي همچون تشابه يا  ارتباط بين سايت هاي مختلف وب است. شاخه ديگر آن كاربرد كاوي وب مي باشد كه سعي مي  كند از تعاملات كاربربا وب ، اطلاعاتي كسب كند و از آن ها بصورت سابقه اي در  مراجعات بعدي كاربر سود ببرد.<br />
در زمينه محتواكاوي وب نرم افزارهاي خزنده<span>(</span>Crawler<span>)</span> ، به گشت و گذار در اقيانوس وب پرداخته ، اقدام به نمايه سازي واژگان در پايگاه  داده خود مي نمايند كه مورد استفاده موتورهاي كاوش ، در زمان جستجوهاي كاربر قرار  مي گيرد. نمونه بارز اين روش ، موتور كاوشگر Google است. .[Chakrabarti,1999]<br />
در همين راستا ابزارهايي همچون FASTUS<span>:</span>Finite-State  Automaton Text Understanding System ، در خلال اين ماموريت به تجزيه و تحليل متون  ، با هدف كشف گروه هاي مختلف واژگان مانند اسامي ، افعال ، تركيبات وصفي و اضافي  ،&#8230; مي پردازند كه به كشف دانش از محتويات وب كمك مي كند. اين روش هم اكنون براي  زبان هاي انگليسي و ژاپني پياده سازي شده است وبصورت بالقوه براي ديگر زبان ها قابل  استفاده است. [Feiyu,2001]<br />
از طرف ديگر استفاده از آنتولوژي<span>(</span>Ontology<span>)</span> در وب در بهينه سازي كاوش در وب پيشنهاد مي گردد. آنتولوژي ، يك فرهنگ واژگان مشترك  بر اساس موضوع سايت براي استاندارد سازي ارائه مفاهيم آن جهت قابل تفسير شدن توسط  ماشين ، تعريف مي كند. آنتولوژي ، يك جزء كليدي وب مفهومي(Semantic Web)  است.  [Heflin,2000]<br />
شخصي كردن وب<span>(</span>Personalization<span>)</span> ، از ديگر روش هاست كه در امر كاوش وب مثمر ثمر است. نمونه اين روش در My Yahoo  قابل مشاهده  است.<br />
يكي ديگر از راه هاي كاوش در مقدار زياد و غير ساختيافته اطلاعات وب ، استفاده از  پايگاه داده چند لايه اي (MLDB) است. هر لايه از اين پايگاه داده ، تعميم بيشتري از  لايه قبلي است. همه لايه ها بجز پايين ترين لايه (كه خود وب است) ، قابل كاوش توسط  يك زبان پرس وجو مثل SQL است. [Osmar,2002]<br />
در پياده سازي روش هاي ساختاركاوي وب ، از تئوري گراف وب بهره مند خواهيم شد كه به  ايجاد ديد ارزشمند در الگوريتم هاي جستجو ، كشف ارتباطات ،&#8230; موثر است.<br />
در خصوص روش هاي كاربرد كاوي وب ، ناوبري كاربر در وب توسط مدل هاي رياضي ماركو<span>(</span>Markov<span>)</span> ، براساس ميزان تجربه كاربر و دارا بودن يا عدم داشتن راهنماي سايت ، تجزيه و تحليل  مي گردد. [Velasquez,2003]</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/14/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/14/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/14/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/14/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/14/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/14/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/14/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/14/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/14/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/14/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/14/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/14/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=14&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/04/27/%d9%85%d8%ad%d8%aa%d9%88%d8%a7-%da%a9%d8%a7%d9%88%db%8c-%d9%88%d8%a8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>جستجوی وب</title>
		<link>http://samashirvan.wordpress.com/2008/04/27/%d8%ac%d8%b3%d8%aa%d8%ac%d9%88%db%8c-%d9%88%d8%a8/</link>
		<comments>http://samashirvan.wordpress.com/2008/04/27/%d8%ac%d8%b3%d8%aa%d8%ac%d9%88%db%8c-%d9%88%d8%a8/#comments</comments>
		<pubDate>Sun, 27 Apr 2008 10:28:45 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[اينترنت]]></category>
		<category><![CDATA[کنکاو وب]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=13</guid>
		<description><![CDATA[از آنجاييکه    واسط هاي پرس و جو مرسوم در مستندات ايندکس    گذاري شده توسط کلماتي که در آن ها ظاهر    مي شوند متمرکز مي کنند , پتانسيل بهره برداري    اطلاعات شامل ابر پيوند هايي مي شوند که    به صفحه اي [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=13&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:right;">از آنجاييکه    واسط هاي پرس و جو مرسوم در مستندات ايندکس    گذاري شده توسط کلماتي که در آن ها ظاهر    مي شوند متمرکز مي کنند , پتانسيل بهره برداري    اطلاعات شامل ابر پيوند هايي مي شوند که    به صفحه اي که در ابتدا تشخيص داده شده اند    اشاره مي کند .</p>
<p style="text-align:right;">متن هاي    ارجاعي صفحات ماقبل پيش از اين توسط کرم    وب جهاني , يکي از اولين موتورهاي جستجو    و خزنده وب .</p>
<p style="text-align:right;">اسپرتاس     يک طبقه بندي نوع هاي مختلف ابر پيوند ها    را معرفي کرد که مي تواند در وب پيدا شود</p>
<p style="text-align:right;">چگونه    پيوند ها مي توان از اطلاعات مختلف تکليف    هاي وابسته در وب  بهره برداري کرد</p>
<p style="text-align:right;">
<p style="text-align:right;">راه ميانبر    اصلي ادراک بود که محبوبيت و بنابراين اهميت    صفحه تا حدي با تعداد پيوندهاي وارده مرتبط    مي شود , آن هم اين اطلاعات مي تواند به طور    سودمند مرتب کردن نتايج پرس و جو موتور    جستجو استفاده شود.</p>
<p style="text-align:right;">درجه وارده    به تنهايي ,اگر چه , اندازه خيلي کم از اهميت    است اما صفحات زيادي متناوباً اشاره مي    شوند بدون اينکه به محتوي صفحه اشاره شده    ارتباط برقرار شود.</p>
<p style="text-align:right;">
<p style="text-align:right;">لينبرگ    پيشنهاد کرد که دو نوع از صفحات هستند که    مي تواند براي يک پرس و جو مناسب باشد :</p>
<p style="text-align:right;">منبع      هاي صحيح و موثق (authorities) صفحاتي هستند که      شامل اطلاعات مفيد درباره عنوان پرس و جوها      مي شود</p>
<p style="text-align:right;">در حالي      که هاب ها شامل اشاره گرهايي به منابع اطلاعات      خوب است .</p>
<p style="text-align:right;">هر دو      نوع از صفحات به طور اختياري وصل مي شوند:      هاب هاي خوب شامل شامل اشاره گرهايي به      منبع هاي صحيح و موثق خيلي خوبي است , و منبع      هاي صحيح و موثق خوب توسط هاب هاي خيلي خوبي      اشاره مي شوند</p>
<p style="text-align:right;">کلينبرگ    پيشنهاد استفاده آزمايشي کردن از اين ارتباط    را توسط وابسته کردن هر صفحه  x  به    يک منبع هاب H(x)  و يک منبع صحيح و موثق    A(x) کرد , که به طور تکرار کننده محاسبه مي    شود</p>
<p style="text-align:right;">در اينجا    (x,y) به معني اين است که يک پيوند از صفحه    x به صفحه y وجود دارد. اين محاسبات به باصطلاح    زيرگراف متمرکز شده وب هدايت مي شود , که    توسط  افزودن نتيجه جستجو پرس و جو هاي    مرسوم با تمام صفحات ماقبل و مابعد فراهم    مي شود</p>
<p style="text-align:right;">درجه هاي    هاب و منبع هاي موثق وصحيح به طور يکسان    با A0(x)=H0(x)=1.0 مقدار دهي اوليه و طبيعي مي    شود بدين منظور آن ها قبل از هر تکرار با    يک جمع مي شوند</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/13/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/13/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/13/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/13/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/13/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/13/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/13/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/13/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/13/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/13/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/13/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/13/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=13&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/04/27/%d8%ac%d8%b3%d8%aa%d8%ac%d9%88%db%8c-%d9%88%d8%a8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
		<item>
		<title>گراف وب</title>
		<link>http://samashirvan.wordpress.com/2008/04/27/%da%af%d8%b1%d8%a7%d9%81-%d9%88%d8%a8/</link>
		<comments>http://samashirvan.wordpress.com/2008/04/27/%da%af%d8%b1%d8%a7%d9%81-%d9%88%d8%a8/#comments</comments>
		<pubDate>Sun, 27 Apr 2008 10:27:16 +0000</pubDate>
		<dc:creator>samashirvan</dc:creator>
				<category><![CDATA[کنکاو وب]]></category>
		<category><![CDATA[گراف وب]]></category>

		<guid isPermaLink="false">http://samashirvan.wordpress.com/?p=12</guid>
		<description><![CDATA[وب ممکن    است به عنوان  يک گراف ( مستقيم) با مستندات    به عنوان گره ها و ابرپيوند ها به عنوان    لبه ها مشاهده شوند
درجه هاي    وارده ( تعداد پيوندهاي ورودي ) و درجه هاي    خارجه ( تعداد پيوند هاي خروجي [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=12&subd=samashirvan&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:right;">وب ممکن    است به عنوان  يک گراف ( مستقيم) با مستندات    به عنوان گره ها و ابرپيوند ها به عنوان    لبه ها مشاهده شوند</p>
<p style="text-align:right;">درجه هاي    وارده ( تعداد پيوندهاي ورودي ) و درجه هاي    خارجه ( تعداد پيوند هاي خروجي ) از پخش قانون    قدرت پيروي مي کنند  .</p>
<p style="text-align:right;">مقدار    2.45 =inγ : درجه هاي وارده</p>
<p style="text-align:right;">مقدار=    2.1 outγ : درجه های خارجه</p>
<p style="text-align:right;">داده ها    را از جستجو در آلتاويستا ( سايت جستجو)    با 2003 ميليون URL و 1466 ميليون لينک , و ساختار    گراف زيرين را در يک سرور اتصال ذخيره کردند    , که يک مستند کارامد تکنيک ايندکس گذاري    را پياده سازي مي کند</p>
<p style="text-align:right;">اجازه    دسترسي سريع به ابر پيوند صادر شونده و    هم وارد شونده يک صفحه را مي دهد.</p>
<p style="text-align:right;">گراف داخلي    GB 9.5 از حافظه را پر کرد , و يک جستجوي سطح    اول که به 100 ميليون گره رسيد در حدود 4 دقيقه    طول کشيد.</p>
<p style="text-align:right;">نتيجه    اصلي شان  يک تحليل از ساختار گراف وب    است که بر طبق آن ها , بند قوس بزرگ , با يک    قطعه هسته وصل شده قوي (SCC) 56 ميليون صفحه     در وسط , و دو قطعه با 44 ميليون صفحه در تمام    کنارها, يکي شامل صفحاتي  است که SCC مي    تواند برسد ( بخش داخلي )</p>
<p style="text-align:right;">ديگري    شامل صفحاتي است که از SCC  مي تواند برسد(    بخش خارجي</p>
<p style="text-align:right;">لوله هايي    وجود دارد که رسيدن به بخش خارجي از بخش    داخلي بدون پاس کردن از طريق SCC را اجازه    مي دهد , و پيچک هاي بسياري , که به خارج از    مجموعه داخلي يا داخل مجموعه خارجي بدون    ارتباط با اجزاهاي ديگر هدايت مي کند.</p>
<p style="text-align:right;">چندين    مجموعه هاي کوچکتر وجود دارد که نمي تواند    از هر نقطه اي در اين ساختار رسيده شود.</p>
<p style="text-align:right;">کروکي    يک نمودار از اين ساختار , که گاهي اوقات    فريبنده است  به خاطر اينکه نقش برجسته    بخش داخلي , خارجي , و SCC فقط بر پايه اندازه    پايه گذاري مي شود</p>
<p style="text-align:right;">ساختار    هاي ديگري با يک شکل مشابه وجود دارد , اما    قدري کوچکتر از اندازه هستند ( يعني , لوله    ها ممکن است شامل اجزاء شديداَ متصل ديگر    شوند که با SCC  فقط در اندازه فرق دارند)</p>
<p style="text-align:right;">نتيجه    اصلي اين است که چندين اجزاء گسسته وجود    دارد. در حقيقت , يک منطقه ميان دو صفحه به    طور تصادفي انتخاب شده وجود داشته باشد    فقط حدود 0.24 است</p>
<p style="text-align:right;">احتمال    اينکه يک صفحه توسط موتور جستجو A ايندکس    گذاري شود مستقل است  از احتمال اينکه    همان صفحه توسط موتور جستجو B ايندکس گذاري    شود</p>
<p style="text-align:right;">درصد صفحات    در مجموعه نتيجه يک پرس و جو براي موتور    جستجو B که همچنين توسط موتور جستجو A ايندکس    گذاري مي شود مي تواند روي همرفته به عنوان    يک تخمين  براي ذرصد صفحات ايندکس گذاري    شده توسط A  استفاده شود.</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/samashirvan.wordpress.com/12/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/samashirvan.wordpress.com/12/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/samashirvan.wordpress.com/12/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/samashirvan.wordpress.com/12/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/samashirvan.wordpress.com/12/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/samashirvan.wordpress.com/12/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/samashirvan.wordpress.com/12/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/samashirvan.wordpress.com/12/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/samashirvan.wordpress.com/12/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/samashirvan.wordpress.com/12/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/samashirvan.wordpress.com/12/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/samashirvan.wordpress.com/12/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=samashirvan.wordpress.com&blog=3538242&post=12&subd=samashirvan&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://samashirvan.wordpress.com/2008/04/27/%da%af%d8%b1%d8%a7%d9%81-%d9%88%d8%a8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/c17bb393dc4d64c7a768133bdefa78d2?s=96&#38;d=identicon" medium="image">
			<media:title type="html">samashirvan</media:title>
		</media:content>
	</item>
	</channel>
</rss>