Thursday, May 31, 2007

How to Write a Spelling Corrector


" In the past week, two friends (Dean and Bill) independently told me they were amazed at how Google does spelling correction so well and quickly. Type in a search like [speling] and Google comes back in 0.1 seconds or so with Did you mean: spelling. (Yahoo and Microsoft are similar.) What surprised me is that I thought Dean and Bill, being highly accomplished engineers and mathematicians, would have good intuitions about statistical language processing problems such as spelling correction. But they didn't, and come to think of it, there's no reason they should: it was my expectations that were faulty, not their knowledge."


Read the the rest of Peter Norvig's article here on his site.

Monday, May 21, 2007

سپندارمذگان و سامی یوسف

پنج شش سالی ست که روز ولنتاین در ایران هم نمود و رونقی پیدا کرده، و پشت شیشه بعضی مغازه‌ها نوشته‌هایی درمورد فروش ویژه این روز دیده می‌شود، اما یکی دوسالی است که حوالی ولنتاین کلمه "سپندارمذگان" هم شنیده می‌شود. سپندارمذگان، روز 29 بهمن، روزی بوده که در ایران باستان گرامی داشته می‌شده و در آن زنان و شوهران به هم هدیه می‌دادند، این روز، 4 روز پس از ولنتاین فرنگی‌هاست و به دلیل همین تقارن، عده‌ای آن روزهای آخر بهمن را با نام سپندارمذگان به هم تبریک می‌گویند.

دو سه سالی هم هست که در ایام اعیاد مذهبی، صدای خواننده‌ای را می‌شنویم که با آهنگ‌های عربی یا ایرانی، اما به زبان انگلیسی مولودی خوانی می‌کند، "سامی یوسف" را عرض می‌کنم، حتما تا به حال این سو آن سوی وب لینک‌های آهنگ‌های ایشان را زیاد دیده‌اید ویا از مجریان محترم صدا سیما شنیده‌اید که به علت تقاضاهای مکرر مخاطبان، فلان آهنگ سامی یوسف را دوباره پخش می‌کنیم.

دو موردی که بالا گفتم شاید بی‌ربط به نظر بیایند اما هر دویشان چیزمشترکی دارند که در من احساس ناراحت کننده‌ای ایجاد می‌کند. البته من شخصاً نه با هدیه دادن مشکلی دارم، نه با یادآوری رسوم نیک گذشتگان. همینطور قصد این را ندارم که بگویم با چه آهنگی با چه زبانی باید خواند یا چه چیز باید خواند یا نباید خواند، و به نظرم اینطور باید و نبایدها راه به جایی نمی‌برند. آن احساس ناراحت کننده یا بهتر بگویم غمگین کننده به خاطر چیزی است که این‌ها را جذاب کرده است.

چه چیزی باعث شده سپندارمذگان را بشناسیم و برایمان مهم بشود؟ اگر دغدغه فرهنگ و تمدن ایرانی را داریم پس چرا جشن‌های دیگر ایران باستان را که از سپندارمذگان مهم‌تر و معروف‌تر بودند را نمی‌شناسیم و چرا کسی علاقه‌ای به دانستن درباره آنها نشان نمی‌دهد؟ اگر 25 بهمن جشن ولنتاینی نمی‌بود کسی هم به یاد سپندارمذگان می‌افتاد؟ کلی مولودی و تواشیح با آهنگ‌های مختلف داریم، چرا کارهای سامی یوسف می‌گیرد؟ اگر همین کارها را به فارسی یا عربی هم می‌خواند همین‌قدر کارش می‌گرفت؟

امثال سپندارمذگان و سامی یوسف زیادند، از مسلمان شدن عروس فرنگی و متحول شدن جوان از فرنگ برگشته در سریال‌ها بگیر تا فرمایشات آن آقایی که می‌گفت، کراوات، در اصل مال قوم کروات بوده، و آنها هم در اصل ایرانی اند و در نتیجه کراوات منشأ ایرانی دارد. نمی‌دانم کدام برایم ناراحت کننده‌تر است، اینکه ملاک وجاهت و درستی‌مان اینقدر تقلیدی است، یا اینکه با کمال اعتماد به نفس چیزی که اصل جذابیتش را از غرب گرفته مهر ایرانی و وطنی و مذهبی می‌زنیم.

-----------------------------
البته این را هم بگویم ممکن است برداشت و نتیجه‌گیری من درست نباشد، و ضمنا جنبه سلیقه‌ای این بحث‌ها را هم نباید فراموش کرد، به خاطر اینها بود که گفتم احساس ناراحت کننده.

Friday, May 11, 2007

Murphy's Mother's Law


Murphy's Mother's Law:
"My son was right..."


Look at here for a collection of humorous Murphy's laws!