فرمت مخصوص فايل XML مورد نياز
در فايل xmlي كه به عنوان sitemap مورد استفاده قرار مي گيرد ميبايست از كد گذاري UTF-8 استفاده شود. در زير نمونه ي يك فايل sitemap ساده كه تنها شامل يك آدرس بوده و در آن از تمامي تگهاي اختياري استفاده شده است را مشاهده مي كنيد:

<?xml version="1.0" encoding="UTF-8"?>
< urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
< url>
< loc>http://www.example.com/</loc>
< lastmod>2005-01-01</lastmod>
< changefreq>monthly</changefreq>
< priority>0.8</priority>
</url>
</urlset>

نكات :

1. فايل sitemap حتما بايد با تگ آغازين <urlset> شروع شده و با تگ پاياني </urlset> خاتمه يابد.
2. تگ <url> به عنوان تگ منشاء (parent) براي هر آدرس معرفي شده استفاده گردد.
3. براي معرفي هر آدرس از تگ <loc> استفاده شود.


توضيح تگ هاي مورد استفاده
<urlset> (اجباري)
مشخص كننده نوع استاندارد مورد استفاده در فايل xml


<url> (اجباري)
تگ منشاء براي آدرس هاي معرفي شده. تگهاي بعدي در بين دو تگ ابتدايي و انتهايي اين تگ قرار مي گيرند.


<loc> (اجباري)
مشخص كننده آدرس صفحه معرفي شده. آدرس وارد شده در اين قسمت، مي بايست به صورت كامل وارد شود (پروتكل استفاده شده + آدرس) و نبايد بيش از 2048 كاراكتر باشد.


<lastmod> (اختياري)
مشخص كننده ي آخرين زمان اعمال تغييرات در صفحه معرفي شده كه با استاندارد ISO 8601 تعيين مي گردد. (الگوي كلي به شكل YYYY-MM-DDThh:mm:ss+00:00 است و در آن تعيين زمان اختياري است)


<changefreq> (اختياري)
با استفاده از اين تگ، دوره ي زماني به روز رساني صفحه معرفي شده را تعيين نماييد. براي مثال اگر آدرس صفحه مشخص شده، آدرس وبلاگ شماست، به دليل به روز رساني مداوم وبلاگ در ساعات مختلف روز و تمايل شما در به روز بودن اطلاعات ثبت شده در موتورهاي جستجو، مناسب ترين مقدار براي اين تگ مقدار always به نظر مي رسد.

به زباني ديگر اين تگ مشخص كننده ي آن است كه فايل معرفي شده در چه بازه هاي زماني اي به روز مي شود و بدين ترتيب نرم افزارهاي مرور صفحات در موتورهاي جستجو در دوره هاي زماني متناسب با مقدار تعيين شده، اين فايل را مورد بررسي قرار مي دهند.
از ديگر مقادير مورد قبول اين تگ مي توان به hourly و daily و weekly و monthly و yearly و never اشاره نمود كه به نظر نيازي به توضيح تك تك آنها نيست!


<priority> (اختياري)
با استفاده از اين تگ ارجحيت نسبي صفحه معرفي شده را نسبت به ديگر صفحات سايت خود بيان نماييد. مقدار اين تگ تاثيري در مقايسه صفحات سايت شما با صفحات ديگر سايت ها ندارد و تنها به گوگل اهميت صفحات مورد نظر شما را اطلاع مي دهد. با استفاده از اين مشخصه اولويت مرور و بازخواني صفحات را به spiderهاي موتور جستجو اطلاع دهيد.
مقدار معتبر تخصيص داده شده به اين تگ بين 0.0 و 1.0 مي باشد كه 0.0 نشان دهنده درجه پايين اهميت و 1.0 نشانه پر اهميت بودن صفحه معرفي شده است.
مجددا تاكيد ميكنم كه مقدار تخصيص داده شده به اين تگ تاثيري در محل قرارگيري سايت شما در نتايج جستجوي نمايش داده شده در موتور جستجوي گوگل نخواهد داشت.


نكات اضافي:
علاوه بر آن كه كدگذاري فايل xml بايد utf-8 باشد، براي كاراكترهاي زير نيز بايد از معادل اسكيپ كد (Escape Code) آنها استفاده شود.


& ---> &amp;
' ---> &apos;
" ---> &quot;
> ---> &gt;
< ---> &lt;

براي مثال به آدرس زير دقت نماييد:


http://www.example.com/ümlat.html&q=name

آدرس بالا اگرچه صحيح است ولي براي استفاده در فايل sitemap ميبايست آن را به آدرس زير تبديل نماييد:


http://www.example.com/%C3%BCmlat.html&amp;q=name

فايل sitemap نمونه :
در زير نمونه اي از يك فايل sitemap جهت آشنايي بيشتر آورده شده است.


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&amp;desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=73&amp;desc=vacation_new_zealand</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=74&amp;desc=vacation_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=83&amp;desc=vacation_usa</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>

* براي كاهش حجم فايل sitemap خود و در نتيجه استفاده كمتر از پهناي باند سايت خود ميتوانيد فايل ساخته شده را با استفاده از gzip فشرده كرده و از آن استفاده نماييد. در اينجا ذكر اين نكته مهم است كه فايل ساخته شده در حالت معمول (فشرده نشده) نبايد فضاي بيش از 10 مگابايت را اشغال كند.


ساخت فايل sitemap جهت ارتباط بين چند فايل sitemap
همانطور كه پيش از اين - در مقالات پيشين - نيز ذكر شد فايل sitemap ساخته شده نبايد بيش از 50000 آدرس را دربرگيرد و همچنين نبايد فضاي بيش از 10 مگابايت را اشغال كند. حال اگر نياز به معرفي تعداد آدرسهاي بيشتري داريد بايد اقدام به ساخت چند فايل sitemap كرده و در فايل ديگري بين اين چند فايل ارتباط برقرار كنيد. در فايل لخير نيز نميتوان بيش از 1000 فايل sitemap را مشخص كرد (كه البته بعيد است به بيش از اين تعداد نياز پيدا كنيد!)
فرمت استفاده شده در فايل معرفي شده شباهت زيادي به فايل هاي sitemap ساده دارد.


<loc> (اجباري)
مشخص كننده آدرس فايلهاي sitemap است.


<lastmod> (اختياري)
آخرين زمان اعمال تغييرات در فايلهاي sitemap معرفي شده كه با استاندارد ISO 8601 تعيين مي گردد. (الگوي كلي به شكل YYYY-MM-DDThh:mm:ss+00:00 است و در آن تعيين زمان اختياري است)

<sitemap> (اجباري)
در برگيرنده دو تگ معرفي شده بالا (<loc> و <lastmod>) براي هر فايل sitemap

<sitemapindex> (اجباري)
در برگيرنده مجموعه تگ هاي <sitemap> كه براي معرفي هر فايل استفاده شده است.


* دقت داشته باشيد كه آدرس فايلهاي معرفي شده بايد از استاندارد هاي معرفي شده براي فايلهاي sitemap استفاده كند. به طور مثال براي كاراكترهاي & و ' و " و > و < بايد از معادل اسكيپ كد آنها كه در بالا معرفي شدند استفاده گردد.

نمونه كد:
در زير نمونه كدي جهت آشنايي بيشتر شما آورده شده است:


<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>

محل قرارگيري فايل Sitemap
پس از ساخت فايل sitemap مي بايست آن را در وب سايت خود قرار دهيد. نرم افزارهاي جستجوگر گوگل تنها قادر به مرور صفحاتي از صفحات معرفي شده در فايل sitemap هستند كه در سطح زيرين (يا هم تراز) پوشه قرارگيري اين فايل قرار گرفته اند. بدين معني كه اگر فايل sitemap شما در پوشه فرضي www.sitename.com/foo قرار داشته باشد، نرم افزارهاي مذكور تنها قادر به مرور صفحات موجود در پوشه foo و پوشه هاي زيرين آن هستند و در صورتي كه در فايل sitemap شما آدرس صفحاتي در ديگر پوشه هاي ريشه ذخيره شده باشد نرم افزارهاي جستجوگر به سراغ آن صفحات نخواهند رفت. لذا بهترين مكان براي قرارگيري فايل sitemap ريشه سايت است (در اينجا www.sitename.com) بدين ترتيب تمامي صفحات معرفي شده در sitemap مرور خواهند شد.


تاييد معتبر بودن فايل sitemap
پس از ساخت فايل، در ادامه بايد با توجه به الگوي معرفي شده از سوي گوگل، فايلهاي ساخته شده اعتبار سنجي شوند.

الگوي هاي معرفي شده:
براي فايلهاي sitemap‌ دربرگيرنده آدرس صفحات سايت :
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd

براي فايلهاي sitemap دربرگيرنده آدرس ديگر فايلهاي sitemap :

http://www.google.com/schemas/sitemap/0.84/siteindex.xsd

براي اعتبار سنجي فايلهاي XML نرم افزارهاي متعددي وجود دارند. جهت آشنايي با هريك و دريافت نرم افزارهاي مربوطه به آدرس هاي W3C XML Schema و XML.com: W3C XML Schema Tools Guide مراجعه كنيد.


براي اعتبارسنجي فايل ساخته شده توسط نرم افزارهاي فوق بايد چند خط كد زير را به عنوان header در ابتداي فايل sitemap خود قرار دهيد.
براي فايلهاي sitemap‌ دربرگيرنده آدرس صفحات سايت از كد زير استفاده كنيد:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">

<url>
...
</url>
</urlset>


براي فايلهاي sitemap دربرگيرنده آدرس ديگر فايلهاي sitemap از كد زير استفاده كنيد:

<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/siteindex.xsd">

<sitemap>
...
</sitemap>
</sitemapindex>


در اين مقاله طرز ساخت فايل sitemap بدون استفاده از نرم افزار جانبي شرح داده شد. در مقالات بعدي به شرح در مورد ديگر موضوعات مرتبط با Google Sitemaps خواهم پرداخت.