Wie sich Mobiltelefone mit Galaxy AI, Apple Intelligence und anderen generativen KIs verändern werden

-

Mit der Integration generativer künstlicher Intelligenz (KI) betreten wir eine neue Ära in der Art und Weise, wie wir mit diesen Geräten interagieren, und machen uns mit kompakten und leistungsstarken Geräten produktiver.

Nach den Kriterien von

Es ist wichtig zu verdeutlichen, dass KI in vielen der von uns verwendeten Anwendungen schon seit langem auf unseren Mobilgeräten präsent ist. Allerdings stehen wir nun vor einer neuen Untergruppe: der generativen künstlichen Intelligenz, auch bekannt als GAI oder „Gen-KI“ (auf Englisch).

Nach Angaben des Technologieunternehmens IBM ist generative KI in der Lage, „als Reaktion auf die Anweisung oder Anfrage eines Benutzers Originalinhalte wie Texte, Bilder, Videos, Audio- oder Softwarecodes zu erstellen“.

Zu den weltweit bekanntesten generativen KIs zählen:

  • ChatGPT
  • DALL-E
  • Stabile Verbreitung
  • Mitten auf der Reise

Große marktführende Unternehmen wie Samsung und Apple stehen an der Spitze dieser Revolution und implementieren diese Technologie in ihre Geräte, um neue und leistungsstärkere Funktionen anzubieten.

Beispielsweise kündigte das südkoreanische Unternehmen in Zusammenarbeit mit Google im Januar dieses Jahres Galaxy AI an, eine Reihe von KI-basierten Funktionalitäten.

Dahinter verbergen sich fortschrittliche Modelle wie Gemini Pro und Ultra, die für die Ausführung komplexer Aufgaben konzipiert sind. Darüber hinaus haben sie Gemini Nano implementiert, eine optimierte Version der schnellen Reaktion für grundlegende Aufgaben wie Bildinterpretation und Zusammenfassungen.

Diese Technologie ist bereits Realität und wird auf Geräte ausgeweitet, die schon seit einiger Zeit auf dem Markt sind. Im Augenblick, Galaxy AI ist in der S-Reihe von S21 bis S24, in faltbaren Telefonen von Z Fold3 bis Z Fold5 und von Z Flip3 bis Z Flip5 sowie in den Tablets Galaxy Tabs S8 und S9 erhältlich.

Dies sind einige der Produkte auf dem kolumbianischen Markt, die bereits über Galaxy AI verfügen.

Foto:Samsung

Wie werden sich Apple iPhones durch KI verändern?

Apple bereitet seinerseits ein Paket neuer Funktionen auf Basis generativer KI vor, darunter ein bedeutendes Update für Siri, seinen virtuellen Assistenten.

Mit diesem Update können Benutzer einfach mit Sprachbefehlen zwischen Dokumenten, Fotos und E-Mails navigieren. Diese Funktionen, Unter dem Namen Apple Intelligence am 10. Juni auf der Entwicklerkonferenz WWDC angekündigt, werden sie im Herbst 2024 der Öffentlichkeit zugänglich sein.

In seiner Ankündigung bemerkte Tim Cook, CEO von Apple, dass sein Ansatz „generative KI mit dem persönlichen Kontext jedes Benutzers kombiniert, um wirklich umsetzbare Informationen zu liefern.“ Darüber hinaus greifen Sie auf völlig private und sichere Weise auf diese Informationen zu und können so das tun, was Ihnen am wichtigsten ist.“

Screenshot der WWDC 2024-Übertragung mit Tim Cook kurz vor der Präsentation von Apple Intelligence.

Foto:Manzana

Funktionsweise und Auswirkungen von KI auf Mobiltelefone

Obwohl das, was hinter der generativen KI steckt, ebenso komplex wie wunderbar ist (Tausende und Abertausende Berechnungen in Sekundenschnelle, bei denen versucht wird, auf der Grundlage von Millionen von Daten aus Texten, Bildern, Codes und Zahlen die beste Antwort auf die gestellte Anfrage zu geben eine Person), Generative KI ist nicht nur Technologieexperten vorbehalten; Es ist so konzipiert, dass es für jedermann zugänglich ist. Um darauf zuzugreifen, verwenden Sie einfach Sprache oder kritzeln Sie auf dem Bildschirm.

Allgemein gesagt, Generative KI in Mobiltelefonen hat sich darauf konzentriert, Lösungen wie die Korrektur und Anpassung von Tönen in Texten, die Zusammenfassung großer Informationsmengen, die Bearbeitung von Fotos, die Transkription von Audio und die Generierung von „Aufklebern“ oder Emojis anzubieten.

Samsung hat sich seinerseits für die Echtzeitübersetzung sowohl persönlich als auch per Anruf sowie für die Generierung von Einzelbildern entschieden, um ein herkömmliches Video in ein Zeitlupenvideo umzuwandeln.

Mario Laffitte, Vizepräsident für Corporate Affairs für Lateinamerika bei Samsung

Foto:Samsung

Mario Laffitte, Vizepräsident für Corporate Affairs für Lateinamerika bei Samsung, begann seine Karriere im Unternehmen im Jahr 2013. Seitdem hat er die Innovationen des Unternehmens wie den Fingerabdruck- und Iris-Leser sowie die Faltbildschirme aus erster Hand miterlebt.

Auf die Frage, ob er glaubt, dass diese generativen KI-Tools alle Nutzer erreichen werden, unabhängig von der Kapazität des Mobiltelefons, antwortete er:

„Nein, das ist technisch nicht möglich, da künstliche Intelligenz eine fortschrittliche Verarbeitungskapazität benötigt. Sicherlich gibt es Mittelklassemodelle, die nicht in der Lage sind, den Bedarf an künstlicher Intelligenz zu decken. aufgrund der technischen Leistungsfähigkeit des Teams.“

Aus diesem Grund, Unternehmen verfolgen einen Ansatz, der Native und Cloud Computing kombiniert.

Im Fall von Samsung nutzt das Unternehmen, wie im Dokument zum Einführungstag von Galaxy AI erläutert, Google Cloud-Dienste für die fortgeschrittenen Modelle, die für die Verarbeitung und Generierung von Texten in den Anwendungen „Notizen“, „Voice Recorder“ und „Tastatur“ von Samsung sowie für die Bearbeitung von Bildern verantwortlich sind die Galerie-Anwendung.

Während grundlegende Aufgaben mit Gemini Nano lokal auf dem Gerät erledigt werden, wie beispielsweise das Transkribieren von Sprachnotizen.

Die Auswirkungen dieses Ansatzes sind erheblich. Native Computing verbessert die Geschwindigkeit und Effizienz, indem es die Latenz und die Abhängigkeit von einer ständigen Internetverbindung reduziert, während Cloud Computing es Ihnen ermöglicht, leistungsfähigere und komplexere KI-Modelle zu nutzen, ohne die Hardware des Geräts zu überlasten.

Es stellt sich jedoch eine notwendige Frage: Was passiert mit unseren Daten?

Datenprivatsphäre

Datenschutz ist ein entscheidendes Anliegen bei der Implementierung generativer KI. Schauen Sie sich nur die ganze Kontroverse an, die Meta, Eigentümer von Facebook und Instagram und anderen Plattformen, mit der Ankündigung auslöste, seine Modelle mit Bildern zu trainieren, die von Nutzern in Europa in ihren sozialen Netzwerken veröffentlicht wurden.

Auf Anfrage der irischen Datenschutzbehörde unterbrach das Unternehmen seinen Versuch, bekräftigte jedoch, dass es nach wie vor „sehr zuversichtlich sei, dass unsere Methode den europäischen Gesetzen und Vorschriften entspricht“, und bekräftigte damit seine Pläne.

Die Diskussion ist nicht unbedeutend, insbesondere wenn wir über Mobiltelefone sprechen, jene Geräte, die wir überall hin mitnehmen, sogar auf die Toilette, und die alle unsere Informationen aufzeichnen, einschließlich unserer biometrischen Daten, wenn wir sie mit einer Smartwatch koppeln.

Zu diesem Zweck hat Apple Private Cloud Compute eingeführt, Server, deren Hardware selbst hergestellt wird und die es ermöglichen, nach den Worten des Unternehmens, „sicherzustellen, dass Daten niemals gespeichert oder offengelegt werden“.

Samsung seinerseits ermöglicht dem Benutzer über sein Konfigurationsfenster, die Informationen nur auf dem Gerät zu verarbeiten. Außerdem, Für Unternehmen ermöglicht es Knox, bestimmte Funktionalitäten zu blockieren, sodass Mitarbeiter keine cloudbasierte generative KI nutzen können.

„Wir achten sehr auf internationale Regulierungsfragen. Schon bevor es konkrete Vorschriften gab, gab es bei uns weltweit anerkannte Protokolle, etwa Samsung Knox, das sich auf die Datensicherheit auf Hardwareebene konzentriert. Die Daten sind im Samsung-Chip geschützt. Die Sicherheitssoftwareschicht wird später bei der Übermittlung der Informationen angewendet. Daher stehen die Daten auf unseren Mobilgeräten unter dem Schutz von Samsung“, sagt Laffitte.

Die Veränderungen, die wir auf dem Markt zu sehen beginnen

Seit Jahren wird über Akkus, Kameras und Prozessoren gesprochen, insbesondere im Hinblick auf CPU und GPU, die teilweise über Leistung und Grafikqualität entscheiden.

Vor dem Aufkommen der generativen KI diskutierten wir über die Raytracing-Technologie in Videospielen, wie sie den Realismus auf dem Bildschirm verbesserte und wie diese leistungsstarken GPUs flüssigere Bilder liefern könnten, indem sie die Bildrate pro Sekunde erhöhen.

Jetzt, Mit der Einführung von KI-Modellen, die für die native Ausführung auf Mobiltelefonen optimiert sind, gewinnen Neural Processing Units (NPU) an Bedeutung.

NPUs sind spezialisierte Prozessoren, die darauf ausgelegt sind, Deep-Learning-Algorithmen und andere KI-Aufgaben mit höherer Geschwindigkeit und geringerem Stromverbrauch auszuführen.

Darstellung eines Snapdragon 8 Gen 3, dem Prozessor, der in Mobiltelefonen wie dem Samsung Galaxy S24 zu finden ist.

Foto:Qualcomm

Es ist absehbar, dass die technischen Spezifikationen von Mobiltelefonen in Zukunft Angaben zur Kapazität ihrer NPUs enthalten werden und so zu einem neuen Standard für die Bewertung der Leistung dieser Geräte werden.

Unabhängig vom Formfaktor (ob faltbar, breiter oder länglich) könnte es auch die Art und Weise verändern, wie wir interagieren, indem wir das Touch-Paradigma hinter uns lassen und uns auf die Stimme einlassen.

Dies ist eines der Versprechen von Apple mit seinem neuen Siri: dass wir durch einfaches Sprechen auf unserem Gerät navigieren, Informationen aus verschiedenen Quellen abrufen oder verschiedene Aktionen in unseren Anwendungen ausführen können.

Bild des Rabbit R1. In Schwarz, sein kleiner Bildschirm. Der rechts abgebildete Zylinder ist ein Mechanismus zum Heben und Senken des Meno. In der Box oben befindet sich eine Kamera, die nach hinten und nach vorne gedreht werden kann.

Bild des Rabbit R1. In Schwarz, sein kleiner Bildschirm. Der rechts abgebildete Zylinder ist ein Mechanismus zum Heben und Senken des Meno. In der Box oben befindet sich eine Kamera, die nach hinten und nach vorne gedreht werden kann.

Foto:Kaninchen

Ein Gerät, das ebenfalls viel Aufmerksamkeit erregt hat, ist das Rabbit R1, ein kleines Mobiltelefon, das sich auf die Interaktion per Sprache konzentriert. Dieses hat einen Bildschirm von nur 2,88 Zoll und Sein Betriebssystem implementiert ein Modell namens „Large Action Model“, das theoretisch mit Hunderten von Webseiten und Anwendungen interagieren kann, um Benutzeranfragen zu erfüllen. Allerdings gibt es derzeit im Internet viel Kritik von Nutzern.

„Ich denke, es gibt viel Potenzial für die Entwicklung von Schnittstellen. Persönlich bevorzuge ich die Schnittstelle mit Text, aber das ist nur meine Meinung. Wir achten sehr auf die Anforderungen der Öffentlichkeit und Sprachschnittstellen werden immer beliebter und komfortabler. Wo wird der Bildschirm in Zukunft stehen? Es könnte in den Gläsern unserer Brillen sein, in Kontaktlinsen … Ich weiß es nicht, aber die Funktionalität wird weiterhin entscheidend sein“, schließt Laffitte.

Schließlich wird wenig darüber gesprochen, was aber den Verlauf der Demokratisierung und Aneignung generativer KI auf Mobiltelefonen markieren kann Wer trägt die Kosten für Cloud Computing? Heute ist es für den Nutzer kostenlos und ohne Einschränkungen, es kann jedoch nicht ausgeschlossen werden, dass sich dies in Zukunft ändern wird.

Um dieses Problem zu lösen, stehen der Industrie neben leistungsstärkeren Prozessoren verschiedene Wege offen. Erstens: Finden Sie mehr und bessere Modelle, die effizient und schnell auf dem Gerät laufen können. Zweitens: Laden Sie eine Art Abonnement auf, um bestimmte Dienste zu nutzen. Drittens: Beschränken Sie die Nutzung der Funktionen, genau wie ChatGPT, das nach einer Reihe von Anfragen (auch nach Bezahlung des Abonnements) den Zugriff auf seine fortschrittlichsten Modelle blockiert.

-