على واجهات المحادثة ، الذكاء الاصطناعي ومجموع الأشياء الصغيرة

قبل بضعة أسابيع ، كنت أقرأ عددًا قليلاً من منشورات المدونة من اثنين من العقول العظيمة في a16z حول كون واجهات المحادثة بدعة والتنبؤ بأن أي مستثمر لن ينظر إلى الشركات الناشئة في مجال الذكاء الاصطناعي خلال عامين.


ظننت أنني سأضيف سنتي الثلاثة إلى المحادثة.
انظر ، من وجهة نظري ، لا يتعلق الأمر بكون أليكسا أحدث بدعة التي وضعها عباقرة أمازون لتعزيز المزيد من الطلبات. يتعلق الأمر بنقطة دخول أخرى وطريقة إضافية للتفاعل مع الأجهزة.


دعني أوضح. عندما كبرت كانت الطريقة الوحيدة للتفاعل هي لوحة المفاتيح. ثم جاء الماوس وواجهة المستخدم الرسومية. ثم جاءت عصا التحكم. ثم (قفزة عملاقة للأمام) شاشة اللمس المتعددة. ثم 10 سنوات أخرى ، وقد قمنا بتصحيح البرمجة اللغوية العصبية الواقعية باستمرار ، حتى عندما تكون مدفونًا في ضوضاء متناسقة. انتقلت من LISP إلى Python ، من 3 أيام لتدريب مدرك بسيط من 3 طبقات إلى 3 دقائق. لقد رأيت مسرحيات النظام الإيكولوجي للحدائق المحاطة تتطور إلى شركات API ومنصات. من جانب العرض (وول مارت) إلى جانب الطلب (فيسبوك) اقتصاديات الحجم. وكل شيء بينهما.


كل ما أراه اليوم هو انتشار طرق مثيرة للتفاعل مع الآلات التي يمكنها فقط أن تدفعنا إلى الأمام. Alexa و Echo هما مجرد البداية. لقد كنت مفتونًا تمامًا بـ Oculus من Facebook و Apple ARkit الجديد.
لذا فإن أفكاري ليست أن واجهات المحادثة المنعزلة ضيقة ، بشكل إجمالي ، مضافة إلى جميع الطرق الأخرى التي نتفاعل بها مع الآلات ، فهي تضيف الكثير. انظر ، يمكنك فعل شيء آخر بكلتا عينيك ويديك وما زلت تتفاعل مع echo و alexa. هذا قوي جدا.


على سبيل المثال ، لنفترض أنك طبيب (أقول هذا لأننا كنا نعمل عليه مؤخرًا) ولديك مشكلة بسيطة جدًا أثناء العمل – يديك وعيناك مشغولتان. ليس أذنيك وفمك. لذا ، من “Alexa ، يرجى تدوين ملاحظات حول المريض تشين” إلى “Alexa هل وصل المريض التالي؟” أرى اليوم طرقًا بسيطة ومفيدة لمساعدة أصحاب الأعمال الصغيرة ، لا سيما في مجال الرعاية الصحية ، على زيادة الكفاءة خلال يوم عملهم.
إنه قليل جدًا ، لكنه دائمًا مجموع الأشياء الصغيرة.


الآن حول الذكاء الاصطناعي والضجيج الحالي: لقد قمت بعمل أطروحتي الأولى حول التعرف على الكلمات المنطوقة باستخدام مفهوم backpropagation متعدد الطبقات في أوائل التسعينيات. الرياضيات موجودة منذ السبعينيات. لذلك لا شيء جديد. ما هو مبتكر هنا هو أن قوة المعالجة أصبحت مجانية تقريبًا (مما يجعل التدريب أسهل إلى حد ما) ونهج جانب العميل (على سبيل المثال iOS 11 coreML) يجعل من السهل جدًا وضع التعلم الآلي في أي أداة صغيرة باستخدام DSP ، وجمع البيانات ، فهم هذه البيانات التي تشتد الحاجة إليها بسرعة كبيرة في الوقت الفعلي وإرسالها إلى سحابتي الذكية. هذا رائع.


بالنسبة لما أفعله الآن ، فإن الجمع بين هذين التقدمين يجعل فكرة “ممارسة القيادة الذاتية” ، والتي هي في الأساس شركة رعاية صحية صغيرة قادرة على التفاعل تلقائيًا مع العملاء (الحجز على أساس مخزون الوقت وأنماط العميل) ، 2. إدارة مخزون الإمدادات (مثل الإمدادات الطبية بناءً على المواعيد والإجراءات) ، و 3. يستنتج الوقت والرسوم ويحسنها لتحقيق الربح – وهو أمر ممكن تمامًا اليوم ، وهو أمر لم أستطع فعله منذ 3 سنوات.
اليوم هاتان التقنيتان ، لأنهما تعملان بشكل جيد في النهاية لتطبيقات العالم الحقيقي ، تمكّنانني من تقديم قفزات كفاءة في مجال الرعاية الصحية ، ولو قليلًا ، عن طريق أتمتة التكاليف الإدارية.

إذن في الختام ، نعم ، من وجهة نظر رأس المال المغامر الذي يبحث عن أول تريليون دولار لبدء التشغيل ، ما نراه اليوم هو الكثير جدًا. يبدو الأمر وكأن الابتكار قد توقف. أوافق على أنه نظرًا لتميز iOS11 و ARKit / CoreML ، فقد نرى بعضًا من زجاج Apple يظهر في الأفق ، وأن زوجًا من ظلال AR المخبوزة جيدًا سينقلنا إلى بُعد آخر من الحشو الرائع. لكن الأشياء الصغيرة تضاف وتساعدني واجهات المحادثة ، المعززة بالذكاء الاصطناعي من جانب العميل ، في حل مشاكل العمل والحياة الحقيقية للأطباء اليوم.