Mit der rasanten Entwicklung der KI-Technologie schießen die Produkte der Agenten aus dem Boden. Von der Demo bis zur realen Anwendung, vom Konzeptnachweis bis zur Kommerzialisierung haben wir die rasante Entwicklung dieses Bereichs miterlebt. Angesichts der vielen Agentenprodukte, die auf dem Markt auftauchen, ist die Frage, wie man ihren tatsächlichen Wert und ihr Entwicklungspotenzial objektiv bewerten kann, zu einem Thema geworden, das eine eingehende Diskussion verdient.
Durch eine eingehende Bewertung von sechs repräsentativen Agent-Produkten wird in diesem Papier versucht, ein relativ objektives Bewertungssystem zu erstellen und die Merkmale und die Positionierung der verschiedenen Produkte zu analysieren.
Agentenbewertung: ein dreidimensionaler analytischer Rahmen
Es gibt einen einfachen, aber effektiven analytischen Rahmen, den wir bei der Bewertung des Wertes von Agentenprodukten verwenden können:
Produktwert = Leistungsvermögen × Glaubwürdigkeit × Nutzungshäufigkeit
Jede dieser drei Dimensionen entspricht einer:
- DurchführungskapazitätStabilität des Produkts bei der Erfüllung von Benutzeraufgaben und der Lieferung brauchbarer Ergebnisse
- Grad der Glaubwürdigkeitob die Nutzer bereit sind, ihr wichtige Aufgaben anzuvertrauen, und ob der Prozess transparent und kontrollierbar ist
- Häufigkeit der NutzungOb das Produkt schnell aufgerufen werden kann, wenn die Benutzer es brauchen, und ob es in die täglichen Arbeitsabläufe integriert ist
Für jede Dimension wird ein Punktesystem von 0-3 Punkten verwendet, und eine Gesamtpunktzahl von 8 oder mehr kann als Qualitätsprodukt mit Marktwettbewerbsfähigkeit angesehen werden.

Eingehende Analyse von sechs Mainstream-Agent-Produkten
Auswahl der Bewertungsthemen
Sechs repräsentative Produkte mit tatsächlichen Nutzern aus dem B- und C-Bereich wurden für diesen Test ausgewählt: Manus, Buckle Space, Lovart, Flowith Neo, Skywork und Super Maggie.
Diethylammoniumchlorid | Art der Positionierung | Haupt-Szenarien | Ausgewählte Funktionen |
---|---|---|---|
Manus | allgemeiner Zweck | Automatisierung von Aufgaben | Ein Satz zur Durchführung des automatischen Abbaus |
Schaltfläche Leerzeichen | allgemeiner Zweck | Szenarienübergreifende Zusammenarbeit | MCP Systematische Integration |
Lovart | vertikal | Design-Erstellung | End-to-End-Designlieferung |
Flowith Neo | allgemeiner Zweck | komplexe Inferenz | Visualisierung der Gedankenkette |
Skywork | vertikal | Bürodokument | Erstellung detaillierter Forschungsberichte |
Super Magee | vertikal | Unternehmen OA | Prozessautomatisierung |
Detaillierte Produktanalyse
Manus: Entdecker mit Konzept
Der größte Beitrag von Manus besteht darin, dem Markt ein neues Paradigma für Agenten zu zeigen - den Übergang von der dialogbasierten Interaktion zur aufgabenbasierten Ausführung. Der Benutzer muss die Anforderungen nur in einem einzigen Satz beschreiben, und das System zerlegt, plant und führt den gesamten Prozess automatisch aus.
Leistung im praktischen Einsatz:
- Erfolgsquote bei der Ausführung: ca. 20%, noch Raum für Optimierung
- Relativ unabhängiges Portal mit begrenzter Integration in das tägliche Arbeitsumfeld
- Gelegentliche Verbindungsabbrüche mitten im Prozess, was die Benutzerfreundlichkeit beeinträchtigt
Bewertung: 1 Punkt für die Umsetzbarkeit, 2 Punkte für die Glaubwürdigkeit, 1 Punkt für die Häufigkeit der Anwendung, insgesamt 4 Punkte
Link:manus.im
Buckelraum: ein allgemeines Programm für vollständige Architektur
Buckle Space zeichnet sich durch seine technische Architektur aus, die eine vollständige Kette von MCP-Aufrufen, Aufgabenorchestrierung und Ergebnisbereitstellung realisiert. Es verfügt über ein hohes Maß an Technik und ist in der Lage, alle Arten von Ausnahmesituationen stabil zu bewältigen.
Zentrale Stärken:
- Integrität der Verbindungen zur Unterstützung einer komplexen Aufgabenplanung
- Systematische MCP-Integration mit starker Werkzeugaufruffähigkeit
- Transparenter Prozess mit Rückverfolgbarkeit bei jedem Schritt
Bewertung: 3 Punkte für die Umsetzungsfähigkeit, 2 Punkte für die Glaubwürdigkeit, 2 Punkte für die Häufigkeit der Anwendung, insgesamt 12 Punkte
Link:coze.co.uk

Lovart: der professionelle Assistent im Bereich des Designs
Lovart ist herausragend im vertikalen Bereich und kann wirklich eine Designausgabe auf "Lieferniveau" erreichen. Die Benutzer müssen nur ihre Anforderungen eingeben, und das System übernimmt automatisch die Auswahl des Stils, die Farbabstimmung, die Gestaltung des Layouts und andere professionelle Aspekte.
Praktische Anwendungsbeispiele:
- Öffentliches visuelles Hauptdesign: Erstellung einer kompletten visuellen Markenlösung auf einmal
- Produktion der MBTI-Suite: serielle Designausgabe in einem einheitlichen Stil
- Produktion von Marketingmaterial: End-to-End-Lieferung vom Bedarf bis zum fertigen Produkt
Punktevergabe: 3 Punkte für die Ausführungsfähigkeit, 3 Punkte für die Glaubwürdigkeit, 2 Punkte für die Häufigkeit der Nutzung, insgesamt 18 Punkte
Link:lovart.ai
Flowith Neo: Einzigartige visuelle Interaktion
Neo ist einzigartig in seinem Interaktionsdesign, das den Denkprozess der KI als visuelle Knoten visualisiert, an denen der Benutzer jeden Denkschritt sehen kann. Herausragend ist seine Fähigkeit zur gleichzeitigen Verarbeitung, die es ermöglicht, mehrere Teilaufgaben gleichzeitig auszuführen.
Technische Highlights:
- Unterstützt die hochgradig gleichzeitige Ausführung von Aufgaben
- Fähigkeit, mit langen Kontexten umzugehen
- Vollständige Transparenz des Begründungsprozesses
Punktevergabe: 3 Punkte für die Ausführungsfähigkeit, 3 Punkte für die Glaubwürdigkeit, 1 Punkt für die Häufigkeit der Nutzung, insgesamt 9 Punkte
Link:flowith.io

Skywork: ein professioneller Akteur in der Büroszene
Skywork ist auf die Erstellung von Bürodokumenten spezialisiert, insbesondere auf die Erstellung von Forschungsberichten und PPTs. Sein bestes Merkmal ist die Rückverfolgbarkeitsfunktion - jede Schlussfolgerung hat eine klare Datenquelle.
Testfall: Kingsoft Office Bestandsanalysebericht
- Automatisierter Zugang zu Datenquellen wie Wertpapierwebseiten, Geschäftsberichten usw.
- Erstellung vollständiger Berichte mit Finanzanalysen und Branchenvergleichen
- In jedem Absatz werden Quellen genannt, um die Überprüfung der Fakten zu unterstützen.
- Endgültige Ausgabe einer einsatzbereiten PPT-Datei
Punktevergabe: 3 Punkte für die Ausführungsfähigkeit, 3 Punkte für die Glaubwürdigkeit, 2 Punkte für die Häufigkeit der Nutzung, insgesamt 18 Punkte
Link:tiangong.cn


Super Magee: Der OA-Assistent mit tiefer Integration
McGee repräsentiert eine andere Klasse von Agenten - den eingebetteten Systemassistenten. Anstatt sich auf die Generierung von Inhalten zu konzentrieren, konzentriert er sich auf die Automatisierung interner Unternehmensprozesse.
Kernfunktionen:
- Erkennung von Rechnungen und automatische Archivierung
- Intelligenter Genehmigungsprozess Urteilsvermögen
- Automatisierte Verarbeitung von Unternehmensberichten
- Smart Fill für Reiseanträge
Punktevergabe: 3 Punkte für die Umsetzbarkeit, 2 Punkte für die Glaubwürdigkeit, 3 Punkte für die Häufigkeit der Anwendung, insgesamt 18 Punkte
Link:letsmagic.co.uk


Spezialisierter Agent vs. Generalisierter Agent: Unterschiedliche Entwicklungspfade
Aus den Ergebnissen der Bewertung geht hervor, dass die drei Produkte mit den höchsten Punktzahlen (Lovart, Skywork und Super Magee) allesamt spezialisierte Agenten in vertikalen Märkten sind, was einige der Merkmale des derzeitigen Marktes widerspiegelt.
Die wichtigsten Stärken von Specialised Agent
Tiefe vor Breite
Spezialisierte Agenten verfügen über ein umfangreiches Know-how in bestimmten Bereichen, das nicht nur den Einsatz von Werkzeugen auf technischer Ebene, sondern vor allem ein tiefes Verständnis von Industriestandards, Benutzererwartungen und Qualitätsanforderungen umfasst.
Skywork zum Beispiel weiß nicht nur, wie man PPTs erstellt, sondern versteht auch die logische Struktur von Geschäftsberichten, die Präsentation von Daten, die Anforderungen an die Glaubwürdigkeit und andere Fachkenntnisse.

Bessere Zustellbarkeit
Spezialisierte Agenten liefern oft "Out-of-the-Box"-Ergebnisse und nicht nur Material oder Entwürfe; Lovart erstellt Entwürfe, die direkt für kommerzielle Zwecke verwendet werden können, und Skywork-Berichte können den Kunden direkt vorgelegt werden.


Chancen für General Purpose Agents
Generische Agenten stehen zwar in einigen Bereichen vor Herausforderungen, aber sie haben auch einen einzigartigen Wert:
- anpassungsfähigFähigkeit, unterschiedliche Missionsanforderungen zu erfüllen
- Lernfähigkeit: kann durch das Feedback der Nutzer kontinuierlich optimiert werden
- Wert der PlattformChance, ein einheitliches Portal für mehrere vertikale Szenarien zu werden
Vertrauensmechanismen: Wichtige Überlegungen für die Agentenkommerzialisierung
Da eine Reihe von Agent-Produkten den Versuch der Kommerzialisierung unternommen hat, ist die Zahlungsbereitschaft der Nutzer zu einem wichtigen Indikator geworden, um den Wert des Produkts zu testen.
Analyse des Zahlungsmodells
Das derzeit vorherrschende Zahlungsmodell ist das Punktesystem:
Angebote | Bezahlung Standard | Kosten pro Einsatz | Qualitätsanforderungen |
---|---|---|---|
Lovart | $10 ≈ 1000 Punkte | ~300 Punkte ($3) | Es muss einmal funktionieren. |
Skywork | $10 ≈ 10000 Punkte | ~500 Punkte ($0.5) | Notwendigkeit einer hohen Qualität der Ergebnisse |
Flowith | $10 ≈ 10000 Punkte | variable Preisgestaltung | Notwendigkeit einer zuverlässigen Umsetzung |
Schlüsselelemente der Vertrauensbildung
In einer kostenpflichtigen Umgebung ist jede Aufgabenausführung gleichbedeutend mit einer "Vertrauenswette" des Nutzers. Der Aufbau von Nutzervertrauen erfordert Aufmerksamkeit in den folgenden Bereichen:
Die Bedeutung der Interpretierbarkeit
Die Produkte von Great Agent haben die folgenden Eigenschaften:
- Transparente Sichtbarkeit des Umsetzungsprozesses
- Unterstützung für Interventionen und Korrekturen in der Mitte des Kurses
- Die Ergebnisse sind nachvollziehbar und überprüfbar
Dies erklärt, warum die Rückverfolgbarkeit von Skywork und die Prozessvisualisierung von Buckle Space so wichtig sind - sie ermöglichen es den Nutzern, die Kontrolle abzugeben" und sich dennoch sicher zu fühlen.
Verkehrseingang und Nutzerbewusstsein: Schlüsselelemente für den Produkterfolg
Selbst bei hervorragender Ausführung und Glaubwürdigkeit kann es bei den Produkten der Agenten zu Engpässen kommen, wenn sie das Problem des "Gefundenwerdens" und "Erinnerns" nicht lösen können.
Status des Teilnahmewettbewerbs
Auf dem Desktop können wir bereits einen harten Wettbewerb zwischen verschiedenen Produkten beobachten, die um das Portal für die Dokumentenverarbeitung konkurrieren. Wenn ein Benutzer ein Dokument zieht und ablegt, können mehrere KI-Assistenten gleichzeitig mit Bearbeitungsoptionen auftauchen.
Mind Occupation Strategie
Szene Bindung
Erfolgreiche Agent-Produkte neigen dazu, eine starke Bindung an bestimmte Nutzungsszenarien einzugehen:
- Denken Sie an Lovart, wenn Sie entwerfen müssen
- Denken Sie an Skywork, wenn Sie einen Bericht schreiben müssen
- Denken Sie an Magee, wenn Sie OA-Prozesse abwickeln müssen
sensorloser Zugang
Die von SuperMagic angewandte Strategie ist bemerkenswert - sie erfordert nicht, dass der Benutzer sie aktiv aufruft, sondern sie erscheint ganz natürlich im Geschäftsprozess. Dieser "stille" Ansatz stellt eine interessante Entwicklung dar.
Auswirkungen auf die Produktentwicklung
Für Entwickler von Agentenprodukten gilt es, ein Gleichgewicht zu finden:
- Aufbau von Produktkapazitäten und Nutzerreichweite
- Funktionelle Integrität und Benutzerfreundlichkeit
- Tiefe des Fachwissens und Breite der Anwendung
Schlussfolgerung: Trends und Chancen bei Agentenprodukten
Bei der eingehenden Analyse von sechs Mainstream-Agent-Produkten lassen sich mehrere interessante Trends beobachten:
- Spezialisierung und Generalisierung gehen Hand in HandVerschiedene Arten von Agentenprodukten haben jeweils ihren eigenen Wertbereich, wobei spezialisierte Produkte in bestimmten Bereichen einen klaren Vorteil haben und generalisierte Produkte in Bezug auf die Anpassungsfähigkeit besser abschneiden.
- Lieferfähigkeit als KernkompetenzBenutzer konzentrieren sich zunehmend auf die Qualität der tatsächlichen Ausgabe der Produkte von Agent, nicht nur auf die Präsentation
- Wachsende Bedeutung von VertrauensmechanismenMit fortschreitender Kommerzialisierung werden Transparenz, Kontrolle und Konsistenz zu Schlüsselelementen, um das Vertrauen der Nutzer zu gewinnen.
- Es gibt einen klaren Trend zur Konsolidierung der PortaleWie es seinen Platz im Arbeitsablauf des Benutzers findet, wird zu einem wichtigen Faktor für den Erfolg des Produkts.
Der zukünftige Agentenmarkt wird wahrscheinlich einen diversifizierten Entwicklungstrend aufweisen, mit unterschiedlich positionierten Produkten, die jeweils ihre eigene Nutzergruppe und ihren eigenen Wertbereich finden. Der Schlüssel liegt darin, die Bedürfnisse der Nutzer genau zu verstehen und das beste Gleichgewicht zwischen Produktfunktionen, Nutzererfahrung und Geschäftsmodell zu finden.