چه بسیار آرزو کردهایم که روزی فناوریای پیدا بشود که مثلا با دستور شفاهی «ویدئوهای فلان هنرپیشه را در حالت خنده به من نشان بده»، بتواند به سرعت در آرشیو فیلم ما بگردد و کمی بعد، پشت سر هم نتایج ویدئویی را به ما نشان بدهد.
حقیقت این است که علیرغم پیشرفت برنامهها، هنوز برنامهها به اندازه کافی هوشمند نشدهاند. در خبر هیجانانگیزی، گوگل روز سهشنبه اعلام کرد که ابزاری برای توسعهدهندگان اپلکیشنها به نام Google Cloud Vision ساخته است که به یاری API آن، برنامهها میتوانند با هوش ماشینی، اشیاء، چهرهها و حالات صورت را تشخیص بدهند.
به این ترتیب دستکم قسمتی از آرزوهایی که در ابتدای پست مطرح کردم، در آینده نزدیک عملی خواهد شد.
برای نمایش قابلیتهای این کار، گوگل یک روبات کوچ بامزه به نام GoPiGo ساخت، در ویدئوی منتشرشده، این روبات را میبینیم که قادر به تعقیب چهرهها و تشخیص حالات صورت است و میتوانند لیوان، موز و پول را از هم تشخیص بدهد.
با این فناوری همچنین میشود لوگوی محصولات را به سرعت روی اجناس سوپرمارکتها تشخیص داد، میتوان به سرعت عکسهایی نامناسب را بیرون آورد یا کاراکترهای متنی را در یک عکس تشخیص داد.
اما وجه دیگر این فناوری را هم باید در نظر گرفت؟
مثلا الان شرکتهای زیادی به صورت تجاری «درون» تحویل آدمهای عادی میدهند، تصور کنید که با دوربینهای همه «درون»ها بشود، به تعقیق اشخاص پرداخت و جاسوسیشان را کرد.
از سوی دیگر بینایی با واسطه، آیا مترادف با داشتن میلیاردها چشم برای گوگل نیست؟!