Model Drift est la deuxième étape du cycle Kuhn. Le cycle commence dans la science normale où un champ a un modèle de compréhension (son paradigme) qui fonctionne. Le modèle permet aux membres d`un champ de résoudre les problèmes d`intérêt. Lorsque des problèmes, des problèmes ou des phénomènes apparaissent, le modèle ne peut pas gérer, le modèle commence à dériver loin de la science normale. Dès que plus d`une petite quantité de dérive se produit, le paradigme du champ est dit être dans la dérive du modèle. Une approche d`ensemble peut être utilisée lorsque le modèle statique est laissé intact, mais un nouveau modèle apprend à corriger les prédictions à partir du modèle statique en fonction des relations dans les données plus récentes. Merci beaucoup pour votre blog, j`ai toujours lu avec beaucoup d`attention. Quelque chose qui est un peu lié pour lequel je n`ai pas trouvé de réponse: Comment devrions-nous adapter un modèle de classification lorsque de nouveaux produits sont nécessaires? Typiquement, la classification pour la reconnaissance faciale, pour laquelle vous pouvez ajouter de nouvelles personnes régulièrement (donc de nouvelles classes de sortie), sans régénérer un modèle à chaque fois? Le comportement des clients dans une boutique en ligne peut changer au fil du temps. Par exemple, si les ventes hebdomadaires de marchandises doivent être prédites, et un modèle prédictif a été développé qui fonctionne de manière satisfaisante. Le modèle peut utiliser des intrants tels que la quantité d`argent dépensé pour la publicité, les promotions en cours d`exécution et d`autres mesures qui peuvent affecter les ventes. Le modèle est susceptible de devenir de moins en moins précis au fil du temps – c`est la dérive du concept. Dans l`application de vente de marchandises, une raison de dérive de concept peut être saisonnalité, ce qui signifie que le comportement d`achat change de façon saisonnière.

Il y aura peut-être des ventes plus élevées pendant la saison des vacances d`hiver que pendant l`été, par exemple. Pour éviter toute détérioration de la précision de prédiction en raison de la dérive conceptuelle, des solutions actives et passives peuvent être adoptées. Les solutions actives reposent sur des mécanismes de déclenchement, par exemple des tests de détection des changements (Basseville et Nikiforov 1993; Alippi et Roveri, 2007) pour détecter explicitement la dérive conceptuelle comme un changement dans les statistiques du processus générateur de données. Dans des conditions stationnaires, toute information fraîche rendue disponible peut être intégrée pour améliorer le modèle. Différemment, lorsque le concept dérive est détecté, le modèle actuel n`est plus à jour et doit être remplacé par un nouveau pour maintenir la précision de prédiction (Gama et al., 2004; Alippi et coll., 2011). Au contraire, dans les solutions passives, le modèle est continuellement mis à jour, par exemple en reformant le modèle sur les échantillons les plus récemment observés (Widmer et Kubat, 1996), ou en appliquant un ensemble de classificateurs (Elwell et Polikar 2011). Ces changements, à leur tour, peuvent être détectés, et s`ils sont détectés, il peut être possible de mettre à jour le modèle appris pour refléter ces changements. La dérive du modèle est causée par ce que Thomas Kuhn a appelé des anomalies. Une anomalie est une découverte inattendue que le paradigme ne peut pas expliquer, ce qui inclut la découverte des problèmes que le paradigme ne peut résoudre.

Habituellement, un modèle de compréhension (un paradigme) peut être modifié pour expliquer les anomalies. C`est ainsi que les théories mûrissent. Mais si certaines anomalies ne peuvent pas être accommodés, ils commencent à s`accumuler. Si trop d`anomalies importantes s`accumulent, le cycle de Kuhn progresse jusqu`à la prochaine étape de la crise du modèle. — Détection de dérive de concept pour les données de streaming, 2015. Je voulais savoir, cependant, si les approches non paramétriques (comme le clustering) aider à prévenir le problème de concept dérive de se poser en premier lieu? Dans les applications d`analyse de données les plus exigeantes, les données évoluent au fil du temps et doivent être analysées en temps quasi réel. Les schémas et les relations dans ces données évoluent souvent au fil du temps, ainsi, les modèles conçus pour l`analyse de ces données deviennent rapidement obsolètes au fil du temps.

Filed under: Uncategorized

Like this post? Subscribe to my RSS feed and get loads more!