Fundament voor AI-ontdekkingstocht
Wat kan er allemaal wel en niet met (generatieve) AI? Hoe profiteren medewerkers maximaal van LLM’s? Om dit te onderzoeken, heeft een UMC samen met Rubicon een proeftuin voor vier verschillende toepassingen neergezet. Dankzij Rubicons AI-platform kon dit snel en laagdrempelig. En kan het UMC in de toekomst gemakkelijk nieuwe technologieën, modellen en use cases toevoegen.
De opkomst van generatieve AI de afgelopen jaren – met large language models (LLM’s) als hoofdrolspeler – heeft een storm teweeg gebracht onder organisaties met een bovengemiddeld digitalisatieniveau. Er zijn talloze bekende voorbeelden van nieuwe, bewezen succesvolle toepassingen die de manier van werken compleet transformeren.
Tegelijkertijd is de houding van veel organisaties afwachtend: zij willen eerst op zorgvuldige wijze ontdekken waar LLM’s goed in zijn en hoe ze daarvan kunnen profiteren.
Een mooi voorbeeld is een niet nader te noemen universitair medisch centrum (UMC), dat bij Rubicon aanklopte met het verzoek een proeftuin voor nieuwe generatieve AI-toepassingen op te zetten.
“Dit UMC kan LLM’s als een black box zien, waardoor het in staat is te focussen op praktische toepassingen en concrete resultaten”, zegt AI Lead bij Rubicon Martin Braaksma. “De oplossingen binnen onze dienst ‘Chat with your own data’ laten medewerkers van het UMC op een laagdrempelige manier kennismaken met AI. De organisatie als geheel kan zo uitvinden wat er allemaal mogelijk is én waar precies de waarde zit. De proeftuin is daarmee, als het goed is, een mooi opstapje naar bredere toepassing van AI.”
Voor ‘Chat with your own data’ gebruikt Rubicon de AI Platform Accelerator, waarmee organisaties binnen een maand (generatieve) AI-toepassingen kunnen realiseren. Dit platform berust op Rubicons AI Foundation, oftewel de basisinfrastructuur en -functionaliteit voor het ontwikkelen en uitvoeren van maatwerk AI-applicaties. Als basis dienen de GPT-modellen die via Azure OpenAI beschikbaar zijn.
Aan de hand van een aantal workshops heeft Rubicon eerst alle requirements verzameld, waarna het solution design is opgeleverd en de mogelijke uses cases verder zijn uitgewerkt. Dit heeft geleid tot de implementatie van vier LLM-gebaseerde use cases. Zo kunnen medewerkers vragen stellen over geüploade bestanden, een gigantische set documenten doorzoeken en LLM-functies toepassen op onderzoeksdata.
Braaksma: “Al onze klanten zijn bezorgd over de bescherming van hun data. Worden de gegevens, zoals bij ChatGPT het geval kan zijn, gebruikt om het model te trainen? Dan bestaat het risico dat de informatie verschijnt in responses buiten de eigen organisatie. Voor het UMC is dit punt extra belangrijk vanwege de medische data. Eén van de belangrijkste voordelen van onze AI Foundation: alles draait volledig binnen de eigen tenant van onze klant.”
Via een data protection impact assessment (DPIA) heeft het UMC met behulp van Rubicon onderzoek gedaan naar mogelijke risico’s rondom persoonsgegevens en maatregelen om die te verkleinen. Om te achterhalen welke gegevens er precies worden verwerkt, verlangde het UMC informatie over de architectuur van de oplossing. Met ondersteuning van Rubicon heeft de organisatie alles veilig kunnen inrichten binnen Azure. De oplossing is daardoor volledig compliant met alle wet- en regelgeving binnen de gezondheidszorg.
De proeftuin als beginstap voor de (generatieve) AI-journey van het UMC kent vier verschillende use cases:
Private chat
Deze toepassing is vergelijkbaar met ChatGPT, maar dan kan data nooit de eigen tenant verlaten.
Bestanden uploaden
Medewerkers van het UMC kunnen één of enkele bestanden uploaden en daar vervolgens prompts op loslaten voor bijvoorbeeld het stellen van vragen of samenvatten van documenten.
Zoeken binnen alle medische documenten
Via Azure AI Search worden 20.000 tot 30.000 medische documenten met daarin protocollen geïndexeerd en doorzoekbaar gemaakt. Medewerkers gebruiken deze functie om, vooral voor handelingen die ze niet dagelijks verrichten, in de enorme zee aan documenten snel het juiste bestand te vinden. Vanwege het risico op misinterpretatie geeft de applicatie geen inhoudelijke antwoorden op vragen.
LLM-functies toepassen op onderzoeksdata
Het AI-platform is gekoppeld met Snowflake, waar onderzoeksdata van het UMC in staat. Daardoor kunnen onderzoekers LLM-functies toepassen op onderzoeksdata. Het UMC beschikt over gigantisch veel diagnostische data en wil daar meer verbanden uit halen. Zo probeert één van de onderzoekers nu om het proces waarbij wordt getoetst of onderzoeksgegevens voldoen aan de onderzoeksnormen kan worden verkort van vier à zes maanden tot enkele weken.
Braaksma, die product owner is van ‘Chat with your own data’, is bijzonder enthousiast over deze laatste toepassing: “Voorheen kon dit alleen met machine learning, nu – waarschijnlijk – met een LLM. Experimenten zoals deze zijn heel belangrijk. Ze helpen met uitvinden wat er allemaal wel en niet mogelijk is met LLM’s.”
Doordat LLM’s zijn getraind op gigantische datahoeveelheden hebben ze extra capabilities ten opzichte van machine learning, dat vooral goed is in voorspellen op basis van patronen. Braaksma: “Ik verwacht dat LLM’s de komende jaren stukken krachtiger worden. En dat ze steeds succesvoller worden in toepassingen die nu nog voorbehouden zijn aan machine learning. LLM’s zijn toegankelijker en betaalbaarder, dus zou een organisatie als het UMC veel meer uit de beschikbare data kunnen halen.”
De AI Foundation van Rubicon is geknipt voor pilots zoals deze. AI-oplossingen kunnen namelijk snel ontwikkeld en geïmplementeerd worden. Daarnaast is het relatief eenvoudig om nieuwe oplossingen en modellen toe te voegen en zijn de kosten voorspelbaar.
“Deze chattoepassingen zijn geen einddoel voor het UMC. Het is een laagdrempelige eerste stap om samen met ons te ontdekken wat er allemaal mogelijk is met AI. Daarnaast wil het ziekenhuis graag leren van de use cases die al lopen. Hoe kan AI of generatieve AI helpen om te innoveren, om de efficiëntie te verhogen of om de kwaliteit te verbeteren? Daarbij gaat het overigens niet alleen om medisch onderzoek, maar ook om de dienstverlening van het ziekenhuis”, vertelt Braaksma.
Aan ambities heeft het UMC geen gebrek. Braaksma: “Het ziekenhuis zou bijvoorbeeld graag meer betekenis uit grote hoeveelheden data halen door alle databronnen te koppelen. Daarnaast willen ze met ons de mogelijkheden rondom afbeeldingen en video’s verkennen. Wij zouden het ziekenhuis kunnen helpen met de technische hulpmiddelen, bijvoorbeeld door GPT-4 Vision neer te zetten.”
Eén van de ideeën voor use cases op dit vlak is volgens Braaksma het analyseren van tekeningen waarin patiënten hun ervaringen uitbeelden. “Zijn er bijvoorbeeld patronen die niet of niet direct zichtbaar zijn voor onderzoekers? De hoop is dat er inzichten uit komen die bijvoorbeeld leiden tot persoonlijkere zorg of betere communicatie met patiënten.”