الگوریتم ‌های گوگل

گراف دانش (Knowledge graph) گوگل چیست؟

در حدود یک دهه گذشته، گراف‌های دانش به زندگی روزمره ما وارد شده‌اند، خواه از طریق دستیارهای صوتی مانند Alexa، Siri یا Google Assistant، نتایج جستجوی بصری یا حتی تجارب شخصی خرید از طریق توصیه کنندگان فروشگاه‌های آنلاین.

گراف‌های دانش می‌تواند به موتورهای جستجو مانند گوگل از داده‌های ساختار یافته درباره موضوعات کمک کند. داده‌های معنایی و نشانه‌گذاری به نوبه خود به پیوند مفاهیم و ایده‌ها کمک می‌کند و تبدیل آن‌ها را به داده‌های ساختار یافته برای پر کردن گراف دانش گوگل آسان‌تر می‌کند.

گراف دانش چیست؟

گراف دانش چیست

گراف دانش یک مدل از حوزه دانش است که توسط متخصصان موضوعی با کمک الگوریتم‌های یادگیری ماشین هوشمند ایجاد شده است.

این یک ساختار و رابط مشترک برای همه داده‌های شما فراهم می‌کند و ایجاد روابط چندجانبه هوشمند در سراسر پایگاه داده شما را امکان‌پذیر می‌کند.

گراف دانش به عنوان یک لایه داده مجازی اضافی ساخته شده است، در بالای پایگاه داده یا مجموعه داده‌های موجود شما قرار دارد تا همه داده‌های شما را در مقیاس پیوند دهد، اعم از ساختار یافته یا بدون ساختار.

تفاوت بین گراف دانش و پایگاه داده گراف چیست؟

پنل گراف دانش

گراف‌های دانش داده هستند. آن‌ها باید ذخیره، مدیریت، توسعه یافته، با کیفیت تضمین شوند و می‌توان آن‌ها را پرس و جو کرد. این به پایگاه داده‌ها و اجزای بالا نیاز دارد که معمولاً در لایه میان‌افزار معنایی پیاده‌سازی می‌شوند.

این روی پایگاه داده «نشسته» است و در عین حال نقاط پایانی خدمات را برای ادغام با سیستم‌های شخص ثالث ارائه می‌دهد.

بنابراین پایگاه داده‌ها پایه هر گراف دانش را تشکیل می‌دهند. به طور معمول، اینها فناوری‌هایی هستند که بر اساس چارچوب توصیف منابع RDF، یک استاندارد W۳C یا بر اساس گراف‌های دارایی‌های دارای برچسب LPG ساخته شده اند.

با این حال، برای انتشار گراف‌های دانش در شرکت‌ها، بیش از یک پایگاه داده مورد نیاز است:

فقط با کمک اجزایی مانند ویرایشگرهای طبقه‌بندی و هسته شناسی، استخراج کننده‌های موجودیت، نقشه بردارهای گراف، اعتبارسنجی، تجسم و ابزارهای جستجو و غیره می‌توان اطمینان حاصل شود که گراف دانش می‌تواند به طور پایدار توسعه و مدیریت شود.

در حالی که پایگاه‌های داده معمولاً توسط مهندسان داده بسیار ماهر یا متخصصان وب نگهداری می‌شوند، رابط‌های واسطه معنایی همچنین به افراد امکان می‌دهد با گراف دانش تعامل داشته باشند که می‌توانند دانش فنی کمتری به جای کسب و کار و دانش تخصصی به گراف‌ها ارائه دهند.

آیا گراف دانش سازمانی با گراف دانش گوگل متفاوت است؟

گراف دانش سازمانی

گراف‌های دانش در همه جا وجود دارند: فیس بوک، مایکروسافت، گوگل، همه آن‌ها گراف‌های دانش خود را به عنوان بخشی از زیرساخت خود به کار می‌برند.

گوگل در مه ۲۰۱۲ نسخه و تفسیر خود را از گراف دانش معرفی کرد. از آن زمان به بعد مفهوم «گراف دانش» رواج بیشتری یافت. در ظاهر، اطلاعات گراف دانش گوگل برای افزایش نتایج جستجو استفاده می‌شود.

علاوه بر این، گراف دانش گوگل همچنین هوش مصنوعی (AI) خود را در هنگام پاسخگویی به سوالات گفتاری مستقیم در دستیارهای Google Assistant و Google Home توسعه می‌دهد.

در پشت صحنه و در عوض، گوگل از گراف دانش خود برای بهبود الگوریتم‌های یادگیری ماشین خود استفاده می‌کند.

گراف دانش گوگل درباره مجموعه معنایی PoolParty

پورتال جستجوی CTCN غنی شده توسط گراف دانش سازمانی اما گراف دانش گوگل در نحوه تعامل کاربران و نمایندگان نرم‌افزار با آن بسیار محدود است.

این تنها چند حوزه از دانش خاص صنعت را پوشش می‌دهد و دانش داخلی شرکت‌ها را پوشش نمی‌دهد. API آن فقط موجودیت‌های تطبیق دهنده فردی را به جای گراف‌های اشیاء به هم پیوسته باز می‌گرداند.

اینجاست که گراف‌های دانش سازمانی مطرح می‌شوند. گراف‌های دانش سازمانی به شرکت‌ها کمک می‌کند تا وب دانش خود را به نمایندگی از حوزه خاص خود ایجاد کنند.

در نتیجه، آن‌ها می‌توانند سیلوهای داده را به طور یکپارچه تجزیه کنند تا از دارایی‌های اطلاعاتی به شیوه‌ای چابک استفاده کنند. علاوه بر این، این یک راه حل مقرون به صرفه است که سیستم‌های IT موجود را جایگزین نمی‌کند، اما تقویت می‌کند.

گراف‌های دانش سازمانی نیازهای امروزی را برای پردازش منابع اطلاعات در زمان واقعی و بازیابی اطلاعات از داده‌های ذخیره شده در سیستم‌های متفاوت برآورده می‌کند.

نکته مهم در مورد ابهام‌زدایی

گراف دانش گوگل

گراف‌های دانش زیادی در جهان وجود دارد. گراف دانش گوگل فقط یک گراف است. موارد دیگر شامل dbpedia. com، Wikidata. org و Inlinks. net می‌باشند. در واقع، هر داده نیمه ساختار یافته‌ای را می‌توان به عنوان گراف دانش توصیف کرد، از جمله پایگاه‌های داده مانند IMDB.

مشخص است که گوگل گراف دانش خود را در ابتدا از مجموعه داده‌های دیگر از جمله ویکی پدیا و دفتر اطلاعات سیا تهیه کرده است. همچنین یک تصور غلط رایج وجود دارد که می‌گوید پنل دانش گوگل ، گراف دانش گوگل است.

این درست نیست، اگرچه پانل دانش ممکن است زیر مجموعه‌ای از داده‌ها را در گراف نشان دهد. پانل دانش تجسم مواردی از داده است که از طریق گراف دانش گوگل به هم متصل شده‌اند، اما گراف دانش گوگل یک ثبت بصری کمتر در مورد موضوعات است.

ابهام‌زدایی نهایی در اصطلاحات است. یک گراف دانش عموماً شامل نهادها توصیف می‌شود، اما گوگل در اسناد عمومی خود از اشخاص به عنوان موضوعات یاد می‌کند. این یک کلمه کاربر پسند برای استفاده است، اما می‌تواند تشخیص اینکه گوگل به طور خاص به نهادها اشاره می‌کند را دشوار کند.

انواع موضوع نهاد

به طور کلی نوع موضوع به هر موجودیت داده می‌شود. ممکن است یک شخص باشد؛ سازمان؛ رویداد؛ مکان یا کشور. اگر هیچ یک از این موارد نیست، معمولاً به سادگی به عنوان «چیز» برچسب‌گذاری می‌شود، اگرچه ممکن است نوع موجودیت توسط گوگل ادامه یابد.

API پردازش زبان طبیعی گوگل سرنخ‌هایی را ارائه می‌دهد که نشان می‌دهد از انواع موجودیت مانند اثر هنری و کالای مصرف کننده استفاده می‌شود. در حال حاضر گوگل در دسته‌بندی صحیح بسیاری از موجودیت‌ها بسیار ضعیف به نظر می‌رسد.

 مزایای گراف دانش برای گوگل

ساخت گراف دانش

با سازماندهی اطلاعات جهان بر اساس موضوع، به جای خزیدن و فهرست‌بندی ساده صفحات وب و وب سایت‌ها، یک موتور جستجو می‌تواند از مزایای متعددی استفاده کند. این موارد شامل مقیاس، تنوع، یکپارچگی اطلاعات و سرعت است.

مزیت مقیاس‌بندی

تعداد صفحات وب موضوعی است که مورد بحث و جدل قرار گرفته است و در حالی که بسیاری معتقدند تعداد آن‌ها بی‌شمار است، مطمئناً تعداد آن‌ها به تریلیون‌ها می‌رسد و هر روز با سرعت زیادی گسترش می‌یابد.

در مقابل، تعداد موضوعاتی که بشر درک کرده است بسیار کمتر است شاید در حدود صدها میلیارد و با سرعت بسیار کمتری در حال رشد است. این بدان معناست که یک تکرار بی‌رویه از ایده‌ها در محتوای موجود در وب وجود دارد.

با ذخیره اطلاعات مربوط به یک موضوع به صورت نیمه ساختار یافته، اطلاعات جهان فضای بسیار کمتری را می‌گیرد و تکرار بسیار کمتری دارد.

تنوع منابع داده سود

ذخیره اطلاعات مربوط به یک موضوع به گوگل اجازه می‌دهد تا به جای ارسال کاربر به یک صفحه وب، از منابع داده متعددی استفاده کند.

این بدان معناست که گوگل می‌تواند حقایق برجسته در مورد یک موضوع را گردآوری کرده و آن‌ها را به شیوه مناسب‌تری برای کاربر یا پرسش کاربر روی صفحه یا از طریق رسانه‌های دیگر نمایش دهد. علاوه بر این، اطلاعات مربوط به یک موضوع از نظر تئوری می‌تواند از منابع دیگری فراتر از اینترنت گرفته شود.

مزیت صداقت اطلاعات

در حالی که گراف دانش گوگل هنوز می‌تواند حاوی نادرستی‌ها و اشتباهات واقعی باشد و ممکن است برای دستکاری توسط متخصصان سئو یا بازیگران بد باز باشد، این رویکرد این مزیت را دارد که حداقل یک موضوع را در اختیار گوگل قرار دهد.

یک واقعیت جدید در مورد یک موضوع ممکن است قبل از افزودن به گراف دانش از برخی آستانه‌های کیفی عبور کند، اما بعید است که این آستانه‌ها توسط گوگل به طور آشکار مورد بحث قرار گیرد.

در جنبه منفی، یک نکته واحد می‌تواند تنوع اطلاعات را کاهش دهد و اگر منابع داده‌ای خودشان جانبدارانه باشند، می‌توانند مستعد سوگیری شوند.

مزایای بازیابی اطلاعات

با سازماندهی اطلاعات بر اساس موضوع، بازیابی اطلاعات بسیار سریعتر می‌شود، هم توسط گوگل و هم توسط کاربر که به دنبال سوزن در انبار کاه است.

چگونه کار می‌کند: جایی که می‌بینید از گراف دانش گوگل استفاده شده است، پس از توضیح اینکه چگونه دانشکده با گراف دانش یکسان نیست، این آشکارترین استفاده از گراف دانش برای اکثر متخصصان سئو است.

با این حال، برای بسیاری از کاربران تلفن‌های هوشمند Android، بیشترین استفاده از گراف دانش در واقع ویژگی «Discover» در صفحه اصلی آن‌ها است.

گوگل می‌تواند از اطلاعات مربوط به رفتار شما برای درک موضوعات مهم برای شما استفاده کند و می‌تواند موضوعات مرتبط را بر اساس سابقه کاربر نشان دهد. موضوعات را می‌توان در Google Trends نیز مشاهده کرد.

از اینجا، گوگل همچنین موضوعاتی را که ممکن است به یکدیگر مرتبط باشند، نشان می‌دهد، اگرچه به نظر می‌رسد این داده‌ها در حال حاضر از جستجوهای دیگر توسط همان کاربران جمع آوری شده است، که گاهی اوقات می‌تواند منجر به لیست موضوعات مرتبط غیر منتظره شود.

گوگل همچنین API جستجوی گراف دانش را همانطور که در بالا نشان داده شده ارائه می‌دهد و در خروجی API NLP خود موجودیت‌ها را نشان می‌دهد.

جستجوی گوگل: و همچنین پنل دانش، هنگامی که سوالی را در جستجوی گوگل تایپ می‌کنید که می‌تواند با استفاده از گراف دانش به آن پاسخ دهد، همچنین یک صفحه نمایش غنی در SERPS دریافت می‌کنید.

این اغلب به ضرر نتایج اصلی جستجو است، و لینک سایت ها را زیر سطح گراف قرار می‌دهد.

جمع بندی و نتیجه گیری

همچنین متخصصان سئو باید درک کنند که چگونه می‌توانند موضوعات موجود در گراف را تحت تأثیر قرار دهند تا تغییرات معنادار در درک محتوای گوگل را تحت تأثیر قرار دهند. بنابراین می توان گفت که ما دائماً با گراف‌های دانش روزانه در تعامل هستیم.

با این حال، گراف‌های دانش و پایگاه داده‌های گراف اصلی هنوز برای بسیاری رمز و راز هستند و به دلیل ورود بدون درز به زندگی ما، بسیاری از ما حتی از میزان وابستگی خود به فناوری، یا بدتر از آن، انتظارات خود آگاه نیستیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا