Or it was trained to be aligned with Musk by receiving higher rewards during rei...

		maronato 5 months ago \| parent \| context \| favorite \| on: Grok: Searching X for "From:Elonmusk (Israel or Pa... Or it was trained to be aligned with Musk by receiving higher rewards during reinforcement learning steps for its reasoning.