Microsoft en R

R is een open source programmeertaal primair ontwikkeld voor statische berekeningen. De afgelopen jaren is het één van de standaardtalen geworden binnen het vakgebied Data Science. Hierdoor is R steeds meer populair geworden. Microsoft heeft dit ook ingezien en heeft in 2015 het bedrijf Revolution Analytics overgenomen dat een eigen distributie van R op de markt bracht. Deze aankoop geeft Microsoft de mogelijkheid om R makkelijk te integreren in verschillende programma’s zoals SQL Server. Kenmerkend voor deze versie van R is dat het de mogelijkheid heeft om bepaalde R-functies parallel over meerdere processors te verdelen. Ideaal voor servers. In deze blog komen de mogelijkheden aan bod om R-code te gebruiken binnen de verschillende Microsoft-producten.

R

R is een statistische open source programmeertaal. Door de open source en de makkelijke manier om eigen code als bibliotheken (packages) te gebruiken en te distribueren, zijn in de afgelopen jaren bijna alle mogelijke type berekeningen en modellen beschikbaar gekomen. Iedereen kan ze gebruiken. Naast wiskundige en statistische bibliotheken zijn er ook veel grafische bibliotheken beschikbaar waarmee bijna elk type grafiek kan worden gemaakt.

Binnen R worden datastructuren in het geheugen opgeslagen als dataframes. R-dataframes zijn flexibele opslagstructuren die worden gebruikt om binnen R wiskundige en statistische berekeningen te maken. Als onderdeel van elke applicatie is er een specifieke mogelijkheid om data tussen de applicatie binnen R beschikbaar te stellen als dataframe. Ook de output van R kan weer worden gebruikt in de host-applicatie in de eigen datastructuur.

Azure Machine Learning

Sinds het begin van de service in 2014, wordt R binnen Azure Machine Learning (AzureML) ondersteund. Door het toevoegen van een ‘Execute R Script’ module aan het experiment, kan de R-code worden aangeroepen. Data kan via AzureML worden geïntegreerd in de R-module zodat de R-code in de module AzureML data kan gebruiken om bijvoorbeeld een modelscore te bepalen. Via eenzelfde soort manier kan de gescoorde data weer verder in de AzureML flow worden gebruikt. Dit biedt de mogelijkheid om bepaalde complexe berekeningen uit te voeren binnen het AzureML experiment, die niet als standaard AzureML module beschikbaar zijn.

Microsoft R Ca Dairy Analysis
Bron: https://acom.azurecomcdn.net/80C57D/cdn/mediahandler/docarticles/dpsmedia-prod/azure.microsoft.com/en-us/documentation/articles/machine-learning-r-quickstart/20160422100031/fig1.png

SQL Server

Met SQL Server 2016 (releasedatum 1 juni 2016) is het mogelijk om R-code aan te roepen binnen SQL Server. Voordeel hiervan is dat gegevens die al zijn opgeslagen in een SQL Server omgeving niet te hoeven worden geëxporteerd om binnen een R-model te gebruiken. Hetzelfde geldt voor de output van een R-model dat niet meer apart hoeft te worden geïmporteerd. Naast de complexe berekeningen kan R ook worden gebruikt om gegevens uit een tabel via specifieke statistische bibliotheken te visualiseren in een Reporting Service rapport.

Microsoft R
Bron: http://blogs.msdn.com/cfs-filesystemfile.ashx/__key/communityserver-blogs-components-weblogfiles/00-00-01-58-94-metablogapi/6786.image_5F00_523CE35A.png

Power BI Desktop

Ook in de Power BI desktop is het mogelijk R-code te gebruiken. Een van de mogelijkheden is om met de data uit Power BI specifieke statistische grafieken als visual op te nemen in een Power BI rapport. Andere mogelijkheid is R te gebruiken om data te genereren en die te gebruiken binnen Power BI. De R-integratie is op dit moment alleen beschikbaar voor de desktop van Power BI en nog niet voor de PowerBI.com service.

Microsoft R Power Bi
Bron: https://dpspowerbi.blob.core.windows.net/powerbi-prod-media/powerbi.microsoft.com/en-us/documentation/articles/powerbi-desktop-r-visuals/20160503062100/r-visuals-6.png

Toekomst

De eerste stappen zijn door Microsoft genomen door het integreren van R in SQL Server, Power BI desktop en AzureML. De volgende stappen zullen (waarschijnlijk), naast het verder integreren van R in andere producten zoals de PowerBI.com service en SQL Server Reporting Service, hopelijk ook te vinden zijn in makkelijkere beheerbaarheid van de R-code. Denk hierbij aan bijvoorbeeld de ondersteuning van Jupyter workbooks in SQL Server, zoals nu ook al mogelijk is binnen AzureML. Ook de integratie tussen de hostapplicatie en de R-runtime kan worden verbeterd.

Maar het belangrijkste is dat R-modellen die worden gemaakt en gevalideerd binnen een organisatie, kunnen worden geïntegreerd met bedrijfsbrede oplossingen.

Nuttige links

AzureML en R 
SQL Server R Services 
Power BI en R-visuals
Power BI en R-script 

Jan Pieter Posthuma - data analytics consultant bij Rubicon met jarenlange ervaring in Business Intelligence-oplossingen met behulp van Microsoft-technieken. Specialisaties: informatieanalyse, data-architecturen en datavisualisatie.


Terug naar het overzicht

Klantcases

Succesvolle migratie naar Microsoft Business Intelligence

Met de migratie naar Microsoft Business Intelligence beschikt Altrecht over een modern en geavanceerd Business Intelligence- platform.

Lees meer

Dynamics CRM groeit uit tot centrale applicatie voor relatiebeheer en meer!

Behoefte aan één 'full service Microsoft-applicatie-dienstverlener' die in staat is op strategisch niveau mee te denken en gezamenlijk de ICT-visie te realiseren.

Lees meer

Optimalisatie kennismanagement met Microsoft SharePoint

Met SharePoint Server 2010 alle aanwezige kennis gestructureerd en snel en laagdrempelig beschikbaar.

Lees meer

Vragen over dit onderwerp?



Copyright Rubicon   |   All Rights Reserved   |   Disclaimer   |   Leveringsvoorwaarden