گراف دانش (Knowledge graph) گوگل چیست؟
در حدود یک دهه گذشته، گرافهای دانش به زندگی روزمره ما وارد شدهاند، خواه از طریق دستیارهای صوتی مانند Alexa، Siri یا Google Assistant، نتایج جستجوی بصری یا حتی تجارب شخصی خرید از طریق توصیه کنندگان فروشگاههای آنلاین.
گرافهای دانش میتواند به موتورهای جستجو مانند گوگل از دادههای ساختار یافته درباره موضوعات کمک کند. دادههای معنایی و نشانهگذاری به نوبه خود به پیوند مفاهیم و ایدهها کمک میکند و تبدیل آنها را به دادههای ساختار یافته برای پر کردن گراف دانش گوگل آسانتر میکند.
گراف دانش چیست؟
گراف دانش یک مدل از حوزه دانش است که توسط متخصصان موضوعی با کمک الگوریتمهای یادگیری ماشین هوشمند ایجاد شده است.
این یک ساختار و رابط مشترک برای همه دادههای شما فراهم میکند و ایجاد روابط چندجانبه هوشمند در سراسر پایگاه داده شما را امکانپذیر میکند.
گراف دانش به عنوان یک لایه داده مجازی اضافی ساخته شده است، در بالای پایگاه داده یا مجموعه دادههای موجود شما قرار دارد تا همه دادههای شما را در مقیاس پیوند دهد، اعم از ساختار یافته یا بدون ساختار.
تفاوت بین گراف دانش و پایگاه داده گراف چیست؟
گرافهای دانش داده هستند. آنها باید ذخیره، مدیریت، توسعه یافته، با کیفیت تضمین شوند و میتوان آنها را پرس و جو کرد. این به پایگاه دادهها و اجزای بالا نیاز دارد که معمولاً در لایه میانافزار معنایی پیادهسازی میشوند.
این روی پایگاه داده «نشسته» است و در عین حال نقاط پایانی خدمات را برای ادغام با سیستمهای شخص ثالث ارائه میدهد.
بنابراین پایگاه دادهها پایه هر گراف دانش را تشکیل میدهند. به طور معمول، اینها فناوریهایی هستند که بر اساس چارچوب توصیف منابع RDF، یک استاندارد W۳C یا بر اساس گرافهای داراییهای دارای برچسب LPG ساخته شده اند.
با این حال، برای انتشار گرافهای دانش در شرکتها، بیش از یک پایگاه داده مورد نیاز است:
فقط با کمک اجزایی مانند ویرایشگرهای طبقهبندی و هسته شناسی، استخراج کنندههای موجودیت، نقشه بردارهای گراف، اعتبارسنجی، تجسم و ابزارهای جستجو و غیره میتوان اطمینان حاصل شود که گراف دانش میتواند به طور پایدار توسعه و مدیریت شود.
در حالی که پایگاههای داده معمولاً توسط مهندسان داده بسیار ماهر یا متخصصان وب نگهداری میشوند، رابطهای واسطه معنایی همچنین به افراد امکان میدهد با گراف دانش تعامل داشته باشند که میتوانند دانش فنی کمتری به جای کسب و کار و دانش تخصصی به گرافها ارائه دهند.
آیا گراف دانش سازمانی با گراف دانش گوگل متفاوت است؟
گرافهای دانش در همه جا وجود دارند: فیس بوک، مایکروسافت، گوگل، همه آنها گرافهای دانش خود را به عنوان بخشی از زیرساخت خود به کار میبرند.
گوگل در مه ۲۰۱۲ نسخه و تفسیر خود را از گراف دانش معرفی کرد. از آن زمان به بعد مفهوم «گراف دانش» رواج بیشتری یافت. در ظاهر، اطلاعات گراف دانش گوگل برای افزایش نتایج جستجو استفاده میشود.
علاوه بر این، گراف دانش گوگل همچنین هوش مصنوعی (AI) خود را در هنگام پاسخگویی به سوالات گفتاری مستقیم در دستیارهای Google Assistant و Google Home توسعه میدهد.
در پشت صحنه و در عوض، گوگل از گراف دانش خود برای بهبود الگوریتمهای یادگیری ماشین خود استفاده میکند.
گراف دانش گوگل درباره مجموعه معنایی PoolParty
پورتال جستجوی CTCN غنی شده توسط گراف دانش سازمانی اما گراف دانش گوگل در نحوه تعامل کاربران و نمایندگان نرمافزار با آن بسیار محدود است.
این تنها چند حوزه از دانش خاص صنعت را پوشش میدهد و دانش داخلی شرکتها را پوشش نمیدهد. API آن فقط موجودیتهای تطبیق دهنده فردی را به جای گرافهای اشیاء به هم پیوسته باز میگرداند.
اینجاست که گرافهای دانش سازمانی مطرح میشوند. گرافهای دانش سازمانی به شرکتها کمک میکند تا وب دانش خود را به نمایندگی از حوزه خاص خود ایجاد کنند.
در نتیجه، آنها میتوانند سیلوهای داده را به طور یکپارچه تجزیه کنند تا از داراییهای اطلاعاتی به شیوهای چابک استفاده کنند. علاوه بر این، این یک راه حل مقرون به صرفه است که سیستمهای IT موجود را جایگزین نمیکند، اما تقویت میکند.
گرافهای دانش سازمانی نیازهای امروزی را برای پردازش منابع اطلاعات در زمان واقعی و بازیابی اطلاعات از دادههای ذخیره شده در سیستمهای متفاوت برآورده میکند.
نکته مهم در مورد ابهامزدایی
گرافهای دانش زیادی در جهان وجود دارد. گراف دانش گوگل فقط یک گراف است. موارد دیگر شامل dbpedia. com، Wikidata. org و Inlinks. net میباشند. در واقع، هر داده نیمه ساختار یافتهای را میتوان به عنوان گراف دانش توصیف کرد، از جمله پایگاههای داده مانند IMDB.
مشخص است که گوگل گراف دانش خود را در ابتدا از مجموعه دادههای دیگر از جمله ویکیپدیا و دفتر اطلاعات سیا تهیه کرده است. همچنین یک تصور غلط رایج وجود دارد که میگوید پنل دانش گوگل ، گراف دانش گوگل است.
این درست نیست، اگرچه پانل دانش ممکن است زیر مجموعهای از دادهها را در گراف نشان دهد. پانل دانش تجسم مواردی از داده است که از طریق گراف دانش گوگل به هم متصل شدهاند، اما گراف دانش گوگل یک ثبت بصری کمتر در مورد موضوعات است.
ابهامزدایی نهایی در اصطلاحات است. یک گراف دانش عموماً شامل نهادها توصیف میشود، اما گوگل در اسناد عمومی خود از اشخاص به عنوان موضوعات یاد میکند. این یک کلمه کاربر پسند برای استفاده است، اما میتواند تشخیص اینکه گوگل به طور خاص به نهادها اشاره میکند را دشوار کند.
انواع موضوع نهاد
به طور کلی نوع موضوع به هر موجودیت داده میشود. ممکن است یک شخص باشد؛ سازمان؛ رویداد؛ مکان یا کشور. اگر هیچ یک از این موارد نیست، معمولاً به سادگی به عنوان «چیز» برچسبگذاری میشود، اگرچه ممکن است نوع موجودیت توسط گوگل ادامه یابد.
API پردازش زبان طبیعی گوگل سرنخهایی را ارائه میدهد که نشان میدهد از انواع موجودیت مانند اثر هنری و کالای مصرف کننده استفاده میشود. در حال حاضر گوگل در دستهبندی صحیح بسیاری از موجودیتها بسیار ضعیف به نظر میرسد.
مزایای گراف دانش برای گوگل
با سازماندهی اطلاعات جهان بر اساس موضوع، به جای خزیدن و فهرستبندی ساده صفحات وب و وب سایتها، یک موتور جستجو میتواند از مزایای متعددی استفاده کند. این موارد شامل مقیاس، تنوع، یکپارچگی اطلاعات و سرعت است.
مزیت مقیاسبندی
تعداد صفحات وب موضوعی است که مورد بحث و جدل قرار گرفته است و در حالی که بسیاری معتقدند تعداد آنها بیشمار است، مطمئناً تعداد آنها به تریلیونها میرسد و هر روز با سرعت زیادی گسترش مییابد.
در مقابل، تعداد موضوعاتی که بشر درک کرده است بسیار کمتر است شاید در حدود صدها میلیارد و با سرعت بسیار کمتری در حال رشد است. این بدان معناست که یک تکرار بیرویه از ایدهها در محتوای موجود در وب وجود دارد.
با ذخیره اطلاعات مربوط به یک موضوع به صورت نیمه ساختار یافته، اطلاعات جهان فضای بسیار کمتری را میگیرد و تکرار بسیار کمتری دارد.
تنوع منابع داده سود
ذخیره اطلاعات مربوط به یک موضوع به گوگل اجازه میدهد تا به جای ارسال کاربر به یک صفحه وب، از منابع داده متعددی استفاده کند.
این بدان معناست که گوگل میتواند حقایق برجسته در مورد یک موضوع را گردآوری کرده و آنها را به شیوه مناسبتری برای کاربر یا پرسش کاربر روی صفحه یا از طریق رسانههای دیگر نمایش دهد. علاوه بر این، اطلاعات مربوط به یک موضوع از نظر تئوری میتواند از منابع دیگری فراتر از اینترنت گرفته شود.
مزیت صداقت اطلاعات
در حالی که گراف دانش گوگل هنوز میتواند حاوی نادرستیها و اشتباهات واقعی باشد و ممکن است برای دستکاری توسط متخصصان سئو یا بازیگران بد باز باشد، این رویکرد این مزیت را دارد که حداقل یک موضوع را در اختیار گوگل قرار دهد.
یک واقعیت جدید در مورد یک موضوع ممکن است قبل از افزودن به گراف دانش از برخی آستانههای کیفی عبور کند، اما بعید است که این آستانهها توسط گوگل به طور آشکار مورد بحث قرار گیرد.
در جنبه منفی، یک نکته واحد میتواند تنوع اطلاعات را کاهش دهد و اگر منابع دادهای خودشان جانبدارانه باشند، میتوانند مستعد سوگیری شوند.
مزایای بازیابی اطلاعات
با سازماندهی اطلاعات بر اساس موضوع، بازیابی اطلاعات بسیار سریعتر میشود، هم توسط گوگل و هم توسط کاربر که به دنبال سوزن در انبار کاه است.
چگونه کار میکند: جایی که میبینید از گراف دانش گوگل استفاده شده است، پس از توضیح اینکه چگونه دانشکده با گراف دانش یکسان نیست، این آشکارترین استفاده از گراف دانش برای اکثر متخصصان سئو است.
با این حال، برای بسیاری از کاربران تلفنهای هوشمند Android، بیشترین استفاده از گراف دانش در واقع ویژگی «Discover» در صفحه اصلی آنها است.
گوگل میتواند از اطلاعات مربوط به رفتار شما برای درک موضوعات مهم برای شما استفاده کند و میتواند موضوعات مرتبط را بر اساس سابقه کاربر نشان دهد. موضوعات را میتوان در Google Trends نیز مشاهده کرد.
از اینجا، گوگل همچنین موضوعاتی را که ممکن است به یکدیگر مرتبط باشند، نشان میدهد، اگرچه به نظر میرسد این دادهها در حال حاضر از جستجوهای دیگر توسط همان کاربران جمعآوری شده است، که گاهی اوقات میتواند منجر به لیست موضوعات مرتبط غیر منتظره شود.
گوگل همچنین API جستجوی گراف دانش را همانطور که در بالا نشان داده شده ارائه میدهد و در خروجی API NLP خود موجودیتها را نشان میدهد.
جستجوی گوگل: و همچنین پنل دانش، هنگامی که سوالی را در جستجوی گوگل تایپ میکنید که میتواند با استفاده از گراف دانش به آن پاسخ دهد، همچنین یک صفحه نمایش غنی در SERPS دریافت میکنید.
این اغلب به ضرر نتایج اصلی جستجو است، و لینک سایت ها را زیر سطح گراف قرار میدهد.
جمعبندی و نتیجه گیری
همچنین متخصصان سئو باید درک کنند که چگونه میتوانند موضوعات موجود در گراف را تحت تأثیر قرار دهند تا تغییرات معنادار در درک محتوای گوگل را تحت تأثیر قرار دهند. بنابراین می توان گفت که ما دائماً با گرافهای دانش روزانه در تعامل هستیم.
با این حال، گرافهای دانش و پایگاه دادههای گراف اصلی هنوز برای بسیاری رمز و راز هستند و به دلیل ورود بدون درز به زندگی ما، بسیاری از ما حتی از میزان وابستگی خود به فناوری، یا بدتر از آن، انتظارات خود آگاه نیستیم.