PinnedMarkel Sanz AusinIntroduction to Reinforcement Learning. Part 5: Policy Gradient AlgorithmsDeep Reinforcement Learning using the policy gradient for stochastic policies. Machine Learning. AI. TensorFlow. PyTorch.7 min read·Nov 25, 2020----
Markel Sanz AusinIntroducción al aprendizaje por refuerzo. Parte 5: políticas de gradienteAlgoritmos de políticas de gradiente (Policy Gradient algorithms), con código ejecutable y derivación matemática. Inteligencia Artificial.7 min read·Nov 25, 2020----
Markel Sanz AusinErrefortzu bidezko ikaskuntzari sarrera. 4. zatia: Double DQN eta Dueling DQN.3. zatian DQN algoritmoak nola funtzionatzen duen ikusi dugu, eta nola ikas dezakeen problema konplexuak ebazten. Zati honetan DQN baino…6 min read·Apr 14, 2020----
Markel Sanz AusinIntroduction to Reinforcement Learning. Part 4. Double DQN and Dueling DQNDouble DQN and Dueling DQN7 min read·Apr 14, 2020----
Markel Sanz AusinIntroducción al aprendizaje por refuerzo. Parte 4: Double DQN y Dueling DQN.En la parte 3 hemos visto cómo funciona el algoritmo DQN, y cómo éste puede aprender a solucionar problemas complejos. En esta parte…7 min read·Apr 14, 2020----
Markel Sanz AusinIntroduction to Reinforcement Learning. Part 3: Q-Learning with Neural Networks, Algorithm DQNQ-Learning with Neural Networks, algorithm DQN5 min read·Apr 3, 2020----
Markel Sanz AusinErrefortzu bidezko ikaskuntzari sarrera. 3. zatia: Q-learning sare neuronalekin, DQN algoritmoa.Bigarren zatian ikusi genuen Q-Learning algoritmoak oso ondo funtzionatzen duela ingurunea sinplea denean eta Q(s, a) funtzioa balioen…5 min read·Apr 3, 2020----
Markel Sanz AusinIntroducción al aprendizaje por refuerzo. Parte 3: Q-Learning con redes neuronales, algoritmo DQN.En la parte 2 vimos que el algoritmo Q-Learning funciona muy bien cuando el entorno es simple y la función Q(s,a) se puede representar…5 min read·Apr 3, 2020----
Markel Sanz AusinIntroducción al aprendizaje por refuerzo. Parte 2: Q-Learning.En la parte 1, hemos descrito el problema del bandido multibrazo, y hemos introducido varios conceptos, como el estado, la acción, la…5 min read·Mar 29, 2020--1--1
Markel Sanz AusinIntroduction to Reinforcement Learning. Part 2: Q-LearningQ-Learning5 min read·Mar 29, 2020--1--1