طرح اولیه وب معنایی بر اساس یک ایده ساده شکل گرفته است صفحات وب برای انسان ها طراحی شده و مشکل هم همین جا است یعنی این صفحات به گونه ای طراحی نشده اند که برای ماشین قابل درک باشند بنابراین هنگامی که در میان انبوهی از داده های وب به دنبال چیزی می گردید ابزار مورد استفاده برای جست و جو اطلاعاتی را در اختیار شما می گذارد که خود از آن ها بی اطلاع است به همین دلیل است که هنگام استفاده از یک موتور جست و جو با حجم زیادی از نتایج روبه رو می شوید که بسیاری از آن ها به آنچه که به دنبال آن هستید ارتباطی ندارد بدیهی است که ماشین منظور شما را درک نمی کند و تنها بر اساس کلید واژه ها با دیگر معیارهای امروزی جست و جو نتایج را نشان می دهد.
با این اوصاف اگر روشی وجود داشت که می شد به کمک آن معنا و مفهوم داده ها را برای ماشین تبیین و تفسیر کرد آن گاه طبیعتاً ماشین می توانست بر اساس نیاز کاربر نتایج به مراتب دقیق تری را در اختیار او قرار دهد.
به طور کلی وب معنایی با هدف تحقق چنین امری در حال توسعه است.
هدف از توسعه وب معنایی ساختارمند کردن داده ها اضافه کردن معانی آن ها و در نهایت بازنمایی دانش به کمک ماشین با استفاده از فناوری ها و استانداردهایی است که به وسیله کنسرسیوم وب جهان گستر در حال تدوین و تکمیل هستند.
به عبارت دیگر در وب معنایی ماشین ها با درک داده ها در فرایند تحلیل و استخراج اطلاعات مورد نظر کاربر مشارکت کرده و در این زمینه هوشمندانه تر عمل می کنند در وب معنایی موتورهای جست و جو و Agent های نرم افزاری بیش از پیش بر مفهوم داده ها و جدا سازی آن ها مسلط هستند در حقیقت وب معنایی بر فناوری ها و استانداردهایی استوار است که این شبکه جهانی را به یک پایگاه داده عظیم تبدیل خواهد کرد.
دستاوردها
اگر چه معرفی عمومی وب معنایی برای نخستین بار در سال 2001 میلادی صورت گرفت اما شگل گیری این ایده و تحقیق و توسعه در این زمینه قدمت بیشتری دارد در واقع در یکی از نخستین کنفرانس هایی که به همت کنسرسیوم وب جهان گستر در سال 1994 برگزار شد برنزلی ایده اولیه به کارگیری نظریه های معنایی در وب را مطرح کرد که البته در آن زمان چندان درک نشد اما در سال 1999 یعنی زمانی که وب معنایی شکل رسمی تری به خود گرفت و اهمیت آن کاملاً آشکار شد نخستین اقدامات جدی و گام های اولیه در این راه برداشته شد.
همچون هر فناوری دیگری، وب معنایی نیز مستلزم تدوین و توسعه استانداردهایی است تا پیاده سازی عملی و گسترده آن امکان پذیر شود یکی از نخستین گام ها در این زمینه فراهم کردن روشی استاندارد برای اضافه کردن معنا و توصیف داده های روی وب به گونه ای است که ماشین بتواند آن ها را بخواند در سال 1995 تلاش هایی برای توسعه فناوری ای که به کمک آن بتوان این داده ها را که فراداده یا متادینا (meta data داده هایی درباره خود داده) نامیده می شوند آغاز شد که در نهایت در سال 1999 به تدوین مشخصات اولیه چارچوب توصیف منابع یا RDF( س نام resource desseiption framework منجر شد.
RDF با استفاده از تگ های XML چارچوبی برای توصیف منابع فراهم می کند در واقع هر چیزی در جهان برای RDF یک منبع یا Resource تلقی می شود که می توان آن را به شکلی استاندارد تعریف کرد RDF برای توصیف داده های وب از یک روش توصیفی مبتنی بر سه جزئی ها یا اصطلاحاً Triples استفاده می کند. هر سه جزئی از موضوع subject ویژگی property که گاهی به آن predicate نیز گفته می شود.
و شیء Objent تشکیل شده است که به نوعی می توان آن ها را در یک جمله به فاعل فعل و مفعول بی واسطه تشبیه کرد سه جزئی ها در قالب تگ های XML نوشته می شوند و به کمک آن ها می توان اطلاعات را در قالب گراف هایی نمایش داد. RDF برای شناساندن این منابع یا به طور دقیق تر اشیاء موضوعات و ویژگی ها به ماشین از URI (uniform resource identifiers استفاده می کند.
همان طور که می دانید URL یا Uniform resource locator متداول ترین فرم URL ها است.
اما همان طور که اشاره شد این تنها نخستین گام برای توسعه وب معنایی است چرا که به هر حال هدف از وب معنایی صرفاً جست و جوی فراداده ها و ارائه نتایج بر اساس آن ها نیست که اگر این گونه بود باز هم می شد آن را یک موتور جست و جوی مبتنی بر پرس و جوهای متنی تلقی کرد.
حال فرض کنید که در یک سند برای اشاره به کد پستی یک شخص از اصطلاح Zip code و در سندی دیگر از عبارت Post code استفاده شده است چگونه ماشین می تواند بفهمد که هر دوی این عبارات به یک چیز اشاره می کند؟ این تشخیص برای ماشین بسیار مشکل است این مشکل و مواردی از این دست نشان می دهد که تنها اضافه کردن فرا داده به داده های موجود روی وب کافی نیست و ماشین برای درک داده های روی وب به چیزی بیش از آن نیاز دارد انسان در تمام طول عمر از زبان طبیعی خود استفاده می کند و به راحتی مفهوم واژه ها و ارتباط میان آن ها را تشخیص می دهد بنابراین صرفاً با اضافه کردن یک لغت نامه کتاب اطلاعات عمومی و ... به کامپیوتر نمی توان چنین چیزی را به کامپیوتر آموخت به منظور فهماندن مفهوم واژه ها و رابطه میان آن ها کامپیوتر ها به چیزی نیاز دارند که هستی شناسی یا آنتولوژی (Ontology) نامیده می شود آنتولوژی ها می توانند مجموعه ای از لغات ساده توصیف دقیق و جزئی واژه ها ارتباطات پیچیده میان آن ها یا مجموعه قوانینی برای تشخیص الگوهای موجود میان داده ها را در بربگیرند در واقع آنتولوژی به عنوان یکی از ارکان اصلی وب معنایی توصیف کننده یک دامنه قابل خواندن به وسیله ماشین است که در بستر وب با استفاده از RDFS سرنام RDF schema و زبان آنتولوژی وب یا owl تعریف می شود.