Markel Sanz Ausin – Medium

Markel Sanz Ausin

Pinned

Markel Sanz Ausin

Introduction to Reinforcement Learning. Part 5: Policy Gradient Algorithms

Deep Reinforcement Learning using the policy gradient for stochastic policies. Machine Learning. AI. TensorFlow. PyTorch.

7 min readNov 25, 2020

--

Introduction to Reinforcement Learning. Part 5: Policy Gradient Algorithms

--

Markel Sanz Ausin

Introducción al aprendizaje por refuerzo. Parte 5: políticas de gradiente

Algoritmos de políticas de gradiente (Policy Gradient algorithms), con código ejecutable y derivación matemática. Inteligencia Artificial.

7 min readNov 25, 2020

--

Introducción al aprendizaje por refuerzo. Parte 5: políticas de gradiente

--

Markel Sanz Ausin

Errefortzu bidezko ikaskuntzari sarrera. 4. zatia: Double DQN eta Dueling DQN.

3. zatian DQN algoritmoak nola funtzionatzen duen ikusi dugu, eta nola ikas dezakeen problema konplexuak ebazten. Zati honetan DQN baino…

6 min readApr 14, 2020

--

Errefortzu bidezko ikaskuntzari sarrera. 4. zatia: Double DQN eta Dueling DQN.

--

Markel Sanz Ausin

Introduction to Reinforcement Learning. Part 4. Double DQN and Dueling DQN

Double DQN and Dueling DQN

7 min readApr 14, 2020

--

Introduction to Reinforcement Learning. Part 4. Double DQN and Dueling DQN

--

Markel Sanz Ausin

Introducción al aprendizaje por refuerzo. Parte 4: Double DQN y Dueling DQN.

En la parte 3 hemos visto cómo funciona el algoritmo DQN, y cómo éste puede aprender a solucionar problemas complejos. En esta parte…

7 min readApr 14, 2020

--

Introducción al aprendizaje por refuerzo. Parte 4: Double DQN y Dueling DQN.

--

Markel Sanz Ausin

Introduction to Reinforcement Learning. Part 3: Q-Learning with Neural Networks, Algorithm DQN

Q-Learning with Neural Networks, algorithm DQN

5 min readApr 3, 2020

--

Introduction to Reinforcement Learning. Part 3: Q-Learning with Neural Networks, Algorithm DQN

--

Markel Sanz Ausin

Errefortzu bidezko ikaskuntzari sarrera. 3. zatia: Q-learning sare neuronalekin, DQN algoritmoa.

Bigarren zatian ikusi genuen Q-Learning algoritmoak oso ondo funtzionatzen duela ingurunea sinplea denean eta Q(s, a) funtzioa balioen…

5 min readApr 3, 2020

--

Errefortzu bidezko ikaskuntzari sarrera. 3. zatia: Q-learning sare neuronalekin, DQN algoritmoa.

--

Markel Sanz Ausin

Introducción al aprendizaje por refuerzo. Parte 3: Q-Learning con redes neuronales, algoritmo DQN.

En la parte 2 vimos que el algoritmo Q-Learning funciona muy bien cuando el entorno es simple y la función Q(s,a) se puede representar…

5 min readApr 3, 2020

--

Introducción al aprendizaje por refuerzo. Parte 3: Q-Learning con redes neuronales, algoritmo DQN.

--

Markel Sanz Ausin

Introducción al aprendizaje por refuerzo. Parte 2: Q-Learning.

En la parte 1, hemos descrito el problema del bandido multibrazo, y hemos introducido varios conceptos, como el estado, la acción, la…

5 min readMar 29, 2020

--

1

Introducción al aprendizaje por refuerzo. Parte 2: Q-Learning.

--

1

Markel Sanz Ausin

Introduction to Reinforcement Learning. Part 2: Q-Learning

Q-Learning

5 min readMar 29, 2020

--

1

Introduction to Reinforcement Learning. Part 2: Q-Learning

--

1

Markel Sanz Ausin

Markel Sanz Ausin

Deep Learning Engineer, NVIDIA

Following

Help
Status
About
Careers
Blog
Privacy
Terms
Text to speech
Teams