Es cierto, en la C64 uno tiene acceso directo a la memoria de video, porque es compartida con la memoria de programas. Eso por un lado hace que la ejecucion de programas sea un poco mas lenta porque el chip de video interrumpe al procesador al acceder a memoria, cosa que no pasa en la MSX, pero tiene la ventaja de que con codigo optimizado se pueden mover graficos mas rapidamente que en MSX. En MSX la memoria de video esta separada y solo accesible por el chip de video, para "pokear" un byte en esa memoria hay que hacer varios "pokes" al chip de video, indicandole primero el comando (poner un byte en VRAM), despues la direccion, y por ultimo el valor. Toda esa burocracia hace que manejar el video sea mas lento y se termine desperdiciando el hecho de que el Z80 sea mas rapido que el 6510, yo lo explique mas o menos simplificado para que se entendiera. Siendo mas especifico, no es que el chip tenga comandos sino que tiene registros para distintas funciones, pero estos se acceden de forma indirecta a traves de otros registros, y tampoco es exacto que se pokee porque para el Z80 son puertos de entrada/salida, pero es mas o menos lo mismo con otros nombres y conexiones.
Tambien hay que tener en cuenta en este caso que el juego esta moviendo graficos con texturas, no son paredes con colores solidos.