سفارش تبلیغ
صبا ویژن

موتور جستجوی با برنامه منبع باز و رایگان (ترجمه)

چکیده

پروژه Nutch، تلاشی برای ایجاد موتورهای جستجوی منبع باز و رایگان می باشد. این پروژه از Lucene به منظور جستجو و ابزار شاخص استفاده می کند. فتچر (روبات) از ابتدا برای این پروژه نوشته شد. پروژه Nutch دارای معماری مدولار سطح بالایی می باشد که به طراحان این امکان را می دهد تا پلاگین هایی را برای فعالیت ها همانند تحلیل نوع رسانه، بازیابی اطلاعات، جستجو و خوشه بندی، ایجاد کنند. داگ کاتینگ به عنوان یکی از توسعه دهندگان پیشگام در پروژه Nutch می باشد. Lucene چیست؟ Lucene به عنوان یکی از نرم افزارهای منبع باز و شاخص رابط برنامه کاربردی (رابط برنامه کاربردی) می باشد که توسط موسسه آپاچی انتشار یافته است. Lucene به صورت جاوا نوشته شده و تحت لیسانس نرم افزاری موسسه آپاچی انتشار یافته است. Lucene به عنوان هسته مرکزی موتور جستجو می باشد. به این ترتیب آن شامل مواردی همانند شبکه های عنکبوتی و برنامه های تجزیه کننده در ارتباط با فرمت های اسناد نمی باشد. در عوض چنین مواردی می بایست توسط افرادی اضافه گردد که از Lucene استفاده می کنند. Lucene در ارتباط با منابع اطلاعاتی، فرمت خاص، و یا زبان خاصی نمی باشد و شما می توانید آن را به متن تبدیل کنید. این بدین معنی می باشد که شما می توانید از Lucene برای ایجاد شاخص و جستجوی اطلاعات ذخیره شده در فایل، صفحات وب بر روی سرورهای شبکه از راه دور و اسناد ذخیره شده در فایل های سیستمی محلی، فایل های متنی ساده، اسناد مایکروسافت، فایل های PDF یا HTML یا فرمت های دیگر، که شما می توانید اطلاعات متنی را از آن دریافت کنید، استفاده کنید. Lucene در فرایند جریان انتقال به زبان های برنامه نویسی دیگر به غیر از جاوا قرار می گیرد.

پروانه کسب (لیسانس) چیست؟

Lucene و Nutch به عنوان پروژه آپاچی بوده و تحت لیسانس آپاچی قرلر دارند.

2 طراحی Nutch

اجزای اصلی Nutch

موتور جستجوی Nutch شامل سه بخش می باشد

1- کرالر، که به اکتشاف و بازیابی صفحات وب می پردازد.

2- WebDB، پایگاه اطلاعاتی به ذخیره URL پرداخته و محتوای صفحات را جمع آوری می کند.

3- برنامه لکسندر، که صفحات را از هم جدا کرده و بر اساس آن ها شاخص های بر مبنای کیبورد را می سازد.

خرید

مطالب مرتبط


ای درارتباط با انتخاب متغیر و مشخصه ها

  • عنوان لاتین مقاله: An Introduction to Variable and Feature Selection
  • عنوان فارسی مقاله: مقدمه ای درارتباط با انتخاب متغیرو مشخصه ها.
  • دسته: آمار
  • فرمت فایل ترجمه شده: WORD (قابل ویرایش)
  • تعداد صفحات فایل ترجمه شده: 33
  • ترجمه سلیس و روان مقاله آماده خرید است.

خلاصه

متغیر وانتخاب مشخصه به عنوان نقطه ثقل اکثر پژوهش ها در زمینه های کاربردی بوده که در ارتباط با آن ها، پایگاه های داده یا صدها یا هزاران متغیر موجود می باشند. این حوزه های شامل پردازش متنی اسناد اینترنتی، تجزیه و تحلیل آرایش ژنی و شیمی ترکیبی می باشد. هدف انتخاب متغیر سه گانه می باشد: که عبارتند از بهبود عملکرد پیش بینی شاخص ها، ایجاد شاخص های به صرفه تر و سریعتر، ایجاد درک بهتری از فرایند اصولی، که داده ها را ایجاد می کند. مشارکت این موضوع خاص، محدوده گسترده ای از جنبه های مرتبط با چنین موضوعاتی را تحت پوشش قرار می دهد: که عبارتند از تعریف بهتری از تابع هدف، ایجاد مشخصه، رده بندی مشخصه، انتخاب مشخصه های چندمتغیری، روش جستجوی مناسب، و روش ارزیابی اعتبار مشخصه.

کلمات کلیدی: انتخاب متغیر، انتخاب مشخصه، کاهش ابعاد فضا، کشف الگو، فیلترها، بسته بندی، خوشه بندی، نظریه اطلاعات، دستگاه های بردار پشتیبانی، انتخاب مدل، تست آماری، بیوانفورماتیک، بیولوژی محاسبه، القای ژنی، میکرو آرایه، علم ژنتیک، پروتومیک، QSAR، دسته بندی متنی، بازیابی اطلاعات.

مقدمه

از سال 1997، زمانی که موضوعات خاصی در این ارتباط شامل چندین مقاله در مورد متغیرها و انتخاب مشخصه منتشر شد، چندین حوزه مورد بررسی از بیش از 40 مشخصه استفاده کرد. این شرایط در طی چند سال گذشته به طور قابل توجهی تغییر یافته است. تکنیک های جدید برای مد نظر قرار دادن این فعالیت های چالشی شامل بسیاری از متغیرهای نامربوط و تکراری و چندین نمونه آموزشی قابل مقایسه مطرح شد.

دو نمونه به عنوان حوزه های کاربردی جدیدی مطرح شده و کمکی به ما بر اساس توضیحات مربوط به این مقدمه می کنند. یکی از آن ها بر مبنای انتخاب ژنی از داده های میکروآرایشی می باشد و دیگری طبقه بندی متن می باشد. در مسئله انتخاب ژن، متغیرها بر مبنای ضریب القای ژن بوده که مطابق با فرواوانی mRNA در یک نمونه (برای مثال بیوپسی بافت) برای تعدادی از بیماران می باشد.

  • فرمت: zip
  • حجم: 1.23 مگابایت
  • شماره ثبت: 411

خرید

مطالب مرتبط


مقاله ابوریحان محمد بن احمد بیرونی

تولد: 12 ذالحجهُ 362 هجری کاث، خوارزم (شهر کارا کلپاکسکایا کنونی وا قع در ا زبکستان)

وفا ت: 4 رجب 440 هجری غزنه (غزنه کنونی در ا فغا نستان)

ابو ریحان بیرونی در خوارزم، منطقه ای که در مجاورت دریا ی آرال قرار دارد و امروزه همه آن را به نام کارا کلپاکسکایا می شناسند، به دنیا آمد. کاث و جورجانیه دو شهر بزرگ این منطقه به شمار می رفتند. بیرونی در نزدیکی کاث به دنیا آمد و نام شهری که در آن متولد شد را به افتخار او، بیرونی نام نهادند. او در هر دو شهر کاث و جورجانیه زندگی کرد و پرورش یافت ومطالعه و تحصیل علم را درحالی که خیلی جوان بود تحت نظر ریاضی دان و ستاره شناس مشهوری به نام ابو نصر منصور آغاز نمود. بی تردید بیرونی از سن 17 سالگی به انجام فعالیتهای علمی مهم و ویژه ای پرداخت. وی در سال 379 با مشاهده بیشترین ارتفاع خورشید، عرض جغرافیایی شهر کاث را محاسبه کرد.

خرید

مطالب مرتبط


برنامه تبدیل عبارت ریاضی infix به postfix درس ساختمان داده

دسته: برنامه نویسی

حجم فایل: 1 کیلوبایت

تعداد صفحه: 1

پیاده سازی یبدیل عبارت ریاضی infix به postfix در زبان سی پلاس پلاس. امیدوارم کاملا مفید واقع شود.

خرید

مطالب مرتبط


HISC: معماری کامپیوتر با استفاده از واصف دستور اجرایی

  • عنوان لاتین مقاله: HISC: A computer architecture using operand descriptor
  • عنوان فارسی مقاله: مجموعه دستورالعمل های کامپیوتری سطح بالا (HISC) : معماری کامپیوتر با استفاده از واصف دستور اجرایی
  • دسته: کامپیوتر
  • فرمت فایل ترجمه شده: WORD (قابل ویرایش)
  • تعداد صفحات فایل ترجمه شده: 18
  • ترجمه سلیس و روان مقاله آماده خرید است.

خلاصه

محاسبات از طریق پردازش مقدار زیادی از داده ها با توجه به محاسبات ابری امروزی انجام می گیرد. امروزه داده ها تنها ارقام نبوده بلکه اطلاعاتی می باشند که می بایست بطور مناسب حفاظت شده و به آسانی قابل انتقال باشند، اما مدل دستوری مبتکرانه ون نیومن از نظر معماری، آن ها را پشتیبانی نمی کند. این فرایند ما را به سمت معماری جدیدی به نام (مجموعه دستورالعمل های کامپیوتری سطح بالا) هدایت می کند، تا نشانه ها را به دستورات اجرایی مجزا در ارتباط با دستورالعمل ها به منظور پردازش کارامد و موثر محاسبات امروزی مرتبط سازد. دستور HISC (مجموعه دستورالعمل های کامپیوتری سطح بالا) شامل کدهای عملیاتی (opcode) بوده، و شاخص مرتبط به دستور اجرایی مبدا یا مقصد توسط واصف دستورات اجرایی مد نظر قرار می گیرد، که شامل مقادیر یا نسبت هایی در ارتباط با دستور اجرایی می باشد. این مقدار و نسبت ها قابل دسترسی بوده و موازی با مراحل اجرایی، قابل پردازش می باشند که به معرفی سیکل ساعتی صفر یا پایین، موارد بالاسری می پردازد. برنامه نویسی مقصود گرا (OOP) نیازمند کنترل دسترسی دقیق داده ها می باشد. مدل جاوا، jHISC، به اجرای برنامه های مقصودگرا جاوا، نه تنها سریعتر از نرم افزار jHISC می پردازد، بلکه حاوی دستوراتی در سیکل پایین تر نسبت به پردازشگرهای جاوا سخت افزاری می باشد. ما همچنین به طرح توسعه آینده در ارتباط با واصف دستورات اجرایی فراتر از برنامه نویسی مقصود گرا (OOP) می پردازیم.

مقدمه

از زمان معرفی کامپیوترها، معماری کامپیوتر به طور معمول بر مبنای معماری وان نیومن، به همراه مفهوم دستگاه برنامه ذخیره کننده می باشد. در این مدل، الگوریتم حل مسئله توسط یک سری از دستورات کامپیوتری نشان داده می شود، که به منظور دستکاری داده ورودی و تولید داده خروجی به اجرا در می آید. دستوراتی که به همراه داده های دستکاری شده به اجرا در می آیند، در حافظه ذخیره می گردند. این دستورات به صورت متوالی به اجرا در می آیند تا زمانی که شاخه گزینی و جا به جایی اهداف با توجه به دستورات کنترل برنامه روی دهد به صورتی که این شاخه ها و انشعابات شرطی با هم در تلاقی باشند. علاوه بر این دستورات I/O برای تعامل با موارد بیرونی وجود دارند.

  • فرمت: zip
  • حجم: 1.02 مگابایت
  • شماره ثبت: 411

خرید

مطالب مرتبط